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SUR LES TABLEAUX DE CORRELATION 
DONT LES MARGES SONT DONNEES 


CAS DE L'ESPACE A TROIS DIMENSIONS ” 


par 


R. FERON 


Considérons l'ensemble E des fonctions de répartition à n dimensions 
F(x) et convenons d'écrire : 


F(x) < G{(x) (relation O) (1) 


si pour tout vecteur * € R" 


F(#) < G(x) (2) 
Il est connu que la relation (1) est une relation d'ordre partiel car 
elle est : 
Réflexive : on a pour tout * F(K)< F(G) 


Antisymétrique : Si on a pour tout * : 
F(X) < G() et F(X) > G(x) 
alors : F(&) = G(x) 
Transitive : Si on a pour tout * 
F(Æ) < G(Æ) et  G(#) < (H(&) alors F(X) < H(&) 
Ceci posé Birkhov a montré que : 


Théorème de Birkhov 


Si x est à une seule dimension, alors l'ensemble E des fonctions de 
répartition constitue un treillis : 


En effet, quels que soient F(x) et G(x) ces éléments ont une borne 
supérieure qui n'est autre que 


Max l F(x) , G(x) | = FM (x) 


(1) Nous tenons ici à exprimer notre reconnaissance à M. J. Bass qui nous a donné 
l'idée d'étudier le cas tridimensionnel, 
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et une borne inférieure qui n'est autre que : 
Min { F(x) , G(x)} = F@ (x) 
F () est bien une fonction de répartition car : 
F1) (-o) = 0 F0 (+oo) = 1 
F9 (x+Ax) = Max [F(x +Ax), G(x + 4x) [=Max [ F(x), G(x)] = F0 (x) 


Par contre dans le cas où x est à 2 dimensions ou plus l'ensemble E 


n'est plus un treillis ni même un demi treillis, car : 
1°) Il existe des fonctions de répartition égales à : 


Max ER, v)= G(x,y)} en XoY 
et supérieures (ou égales) à cette quantité en tout autre point, par exemple : 
FU) (x,y)=la) l'pour xx, et y=—Y, 


b) Max {Fo Yo): G(x5:Y0)} Pour Ex, et": 
ou x => x, LV == y; 


où x,y, est un nombre tel que l'on ait simultanément : 
Fxysco) ; Gx,, ©) , Eco;y,) ,, G(co, y) 
inférieurs à Max [F(x0: Yo) , G(x9: Yo) 

c) Min { Max [F(x,00) ë G(x, 00) |, Max [(F (co, y) ; G(c,y)] 
pour XX, ou rev 


Donc s'il existe une borne supérieure, ce sera nécessairement la 
fonction : 


H(xy)= Max {F(xy) ; G(x:y)} 
2°) Montrons que H n'est pas nécessairement une fonction de répartition, 


En effet pour qu'il en soit ainsi, il faudrait que pour tout couple F et G, 
la quantité 


= H(x+Ax,y+Ay) - H(x+Ax,y) - H(x,y+Ay) + H(x,y) 
soit nécessairement positive ou nulle, 
OLMASLE: 
F(xtAx,y+Ay) = F(xtAx,y)> G(x+Ax,y+4y) 
bien que : 
G(x,y+AY)> F(x,y+Ay) et G(x,y+Ay)> G(x,y) 
alors on a 
(2) 
JE -G(x,y+4y) + Max [F(x, y) ‘ G(x,y)]>0 (3) 


l : a ue 
Donc H n'est pas une fonction de répartition et par conséquent, il 
n'existe pas de borne supérieure, Deux éléments quelconques n'ayant pas 
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nécessairement de borne supérieure, l'ensemble E n'est pas un treillis, 
On démontrerait de même que 2 éléments quelconques de E n'ont pas 
nêcessairement de borne inférieure et par conséquent que E n'est pas 
nécessairement un demi-treillis, 


Or, le théorème de Birkhov nous est apparu comme lié au théorème 
suivant dû à Fréchet (!), 


Théorème de Fréchet.- L'ensemble E (ordonné par Ü) des fonctions de 
répartition F(x,y) de R, ayant des marges données : A(x) = F(x,0), 

= = F(w,y), a un élément maximum F1 (x,y) et un élément minimum 
1% y). 


Or, nous venons de montrer que si F(x,y) € E l'ensemble E ordonné 
0 n'est pas un treillis. Il y a donc lieu de penser que le théorème de Fré- 
chet ne se généralise pas aux espaces Euclidiens à plus de deux dimensions, 


Examinons donc ce qui se passe dans l'espace à 3 dimensions. Ici 2 
cas sont à considérer : 


TABLEAUX DE CORRÉLATION OU LES MARGES (F{x ,00,00), F(00,y,00) 
F(,c,z) SONT DONNEES 


a) méthode brutale 


Considérons maintenant l'ensemble E!,des fonctions de répartition 
F(x,y,z) ayant des marges données A(x) = F(x,00 ,c0), B(y) = F(o ,y,c), 
C(z) = F(c,,z) et supposons E'ordonné,. 


Montrons que cet ensemble a un élément maximum et en général pas 
d'élément minimum. 


1. IL Y A UN ÉLÉMENT MAXIMUM 
On aura évidemment 
F(x, y, z) <Ÿ(x;:y,2) 
en posant : 


ÿ (x,y,z) = Min [A(x), By), C(z) ] 


Il est clair que si nous parvenons à montrer que @ est une fonction de 
répartition, ce sera un élément maximum. Or, il en est bien ainsi, en 


effet : 
1°) (-0,y,z) & A(- ©) 


donc : 
0 Ÿ(-0,y,z) LO et Ÿ(-œ,y,z) = 0 


40 Fréchet. Sur les tableaux de corrélation dont les marges sont données, Ann. 
Univ. Lyon, 9; 1951; p. 53-77. 
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Il en est de même de 
2°) Q(+eo, too, +) = Min | A(+o), Be): C(+09} =1 
3°) Quels que soient x, Ay, Az positifs ou nuls, on a : 


1092 f(xtAx,y+Ay,z#Az)- Q(x,y+Ay,z+Az)- f(x+Ax,y,z+Az) 
- J(x+Ax,y+Ay,2z)+ Ÿ(x+Ax, y, 2z) + Q(x,y,Ay,2z)+ ÿ(x;y,zH 2) a (x,y,2) 


= 10 (x, Ax,y,Ay,z+2) - 1) (x,Ax,y,Ay,z) 
en posant 
1(x,Ax,y,/y,z)= ÿ(x+Ax,y+Ay,z) - Ô (x+Ax,y,z)-0(x,y+Ay,z)+0(x,y,2) 
De même, on a : 
1 (x,Ax,y,Ay,z)=1 2 (x,Ax,y+Ay,2) - IU (x,Ax,y,2) 
en posant : 
1 (x,Ax,y,z) = O(xtAx,y,z) - 0 (x,y,2) 
Sans restreintre la généralité on peut supposer qu'au point x,y,Zz ona: 
A(x)< B(y)<C(z) 
On aura alors 
1" (x,Ax,y,z) = Min [ A(x+4 x), B(y) ] - A(x) 
1 (x,Ax,y,4y,z)=1 0 (x,A x,y+4Ay,z)-1M{(x,Ax,y,z) 


= Min [A(x+Ax), B(y+Ay),C(z) | -A(x)-[Min Bts B(y)] 


= Min [AG+Ax), B(y+Ay),C(2)] - Min | A(x+Ax), B(y)] 
1% = 1 (x, Ax,y,1y,z+A2) - A (x,Ax,y,AYy,2z) 
= Min [A(x+Ax), B(y+Ay), C(2+42)] - Min [AG+Ax), B(y+Ay),C(z)| >0 (4) 


MAN eE a à 3 
quantité évidemment positive ou nulle, Donc ÿ (x,y,z) est bien une fonction 
de répartition et est par conséquent un élément maximum, 


2. IL N'Y A PAS EN GÉNÉRAL D'ÉLÉMENT MINIMUM 


En effet, on a : 
1-F(x,y,z) <Min[(1-A(x) + 1 - B(y) +1 - C(z), 1] (5) 


et on peut avoir l'égalité pour F(x,y,z) convenablement choisi pour un 
Xo Yo Zo donné mais à part cela arbitraire, (On voit en effet que l'égalité 
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aura lieu si on a simultanément Pr (xp Y>y,) sO0Pr(Y>yszZ>z = 0, 
Pr(Z>zeX>x,) = 0 


Or, de (5), ontire : 

F(x,y,z) >Max [A(x) + B(y) + C(z) - 2, ol (6) 
cette borne inférieure pouvant effectivement être atteinte pour certains 
éléments F(x,y,z)., Donc s'il existe un élément minimum ce ne pourra être 
que : 

Y(x;,y,z) + Max { Afx) + B(y) + C(z) - 2, 0} (7) 
Nous allons montrer que b(x,y,z) n'est pas nécessairement une fonc- 
tion de répartition parce que la qualité I({%) relative à y n'est pas nécessai- 
rement positive. 


En effet, nous avons 


1) - b(xt+Ax,y+Ay,z+Az) - d (x+Ax,y+Ay,2) - d (x,y+4y,z+Az) 
= Ÿ (x+Ax,y,z+Az) 


+b(x+Ax,y,z) +4 (x, y+Ay,2z) +b(x;y,z2+A2) - d(x,y,z) 
Supposons que x, y, z, x, Ay, Az aient été choisis tels que : 
b(xtAx,y,z) =b(x,y+Ay,z) =d(x,y,2+Az) = 0 (8) 
alors que : 
p(x+Ax,y+Ay,z) 0 d (x,y+/y,z+0z) >0 d (x+Ax,y,z+0z)>0 
on aura alors 
1%) = A(x+/Ax)+B(y+/y)+C(z+/z)-2- A(x+Ax)+B(y+/Ay)+C(z)-2+A(x+/x) 


+ B(y)+C(z+Az)-2+A(x)+B(y+Ay)+C(z+Az)-2 | 


: [A(x+Ax)+B(y+Ay)+C(z)-2 ]- [A(x)+B(y)+C(z+Az)-2] (9) 


La première parenthèse est positive d'après les hypothèses faites, Si 
donc on a choisi Az de manière que la seconde soit nulle, ce qui est compa- 
tible avec (8) et toujours possible dans Le cas continu, alors I ° est néga- 
tive, ce qui montre que d n'est pas une fonction de répartition en général, 


Autre méthode : valable seulement dans le cas continu 


Sut-F(x,y,z) faisons le changement de variables £ = A(x), n = B(y), 
G= C(z).*Il est connu que dans ces conditions la fonction de répartition 
F(x,y,z) se transforme en une fonction de répartition den) telle que 
G(E,,0)=€ pour 0<É< 1, Go ,7 ,0) = 7 (0<7< 1); Go ,%0,6 ) =6 
(0 £ <1), Etendant légèrement une dénomination de Georges Darmois, 
on peut appeler G(£ ,7,£) la carte de F(x,y,z) sur le cube unité. 
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De plus, on voit immédiatement que la transformation considérée 
conserve l'ordre O défini par (2). Autrement dit, étant données 2 fonctions 
de répartition Fl) (x,y,z) et FC) (x:y2) ayant des marges données A(x), 
B(y), C(z), la relation FÜ) (x,y,z) <F( (x,y,z) pour tout point x,y,z 
entraine la relation similaire sur les transformées G (€, 36) et 
G® (£,7,6) de F® et FA, soit G (6,95 0) Ge (£,7,€) pour tout point 
£,7,€. La réciproque est d'ailleurs exacte, On a donc en définitive : 


FO (x,y,z) <F@ (x,y,z) =G0 (£,7,€) <G® (£:7:€) (10) 


La recherche des éléments maximaux et minimaux sur les fonctions 
de répartition F(x,y,z) ayant des marges données est donc complètement 
équivalente à la recherche des mêmes éléments maximaux et minimaux 
lorsque les variables marginales sont réparties uniformément sur les 
segments 0, 1 des divers axes, Donc, si nous arrivons à montrer que les 
fonctions G admettent un élément maximum et plusieurs éléments mini- 
maux, il en sera nécessairement de même des fonctions F(x,y,z) ayant 
des marges données, 


l°- LES G(£,n,{) ONT UN ÉLÉMENT MAXIMUM 


En effet, on a évidemment : G(£,7,6) < Min [£,9,6] et 
H(£ 59:€) = Min [é,n,6] est bien une fonction de répartition car : 


1) H(-00,7,6) = H(£,-00,4) = H(-w%,€) = 0 
2) H(+co,+co,+oo) = 1 
3) 19 = H(£+AE,N+AT,E+AS) - H(£+AË,n+17,6) 
- H(£,7+A7,6+ÂE) + H(E+AE ,n,6) + H(£,9+A9,€) 
+ H(É,7,CHA6) - H(E,7,6) 
est facile à évaluer si nous supposons par exemple £< }<%,On peut alors 
répéter mot pour mot la démonstration de la page 4 avec les nouvelles 


notations (c'est-à-dire en remplaçant A(x) par£ , B(y) par 9 , C(z) paré et 
une £, B(y) par, C(z) paré 


Support de l'élément maximum 


Il est intéressant de caractériser cette distribution au moyen de la 


ANSE en où : Re 
densité généralisée exoyoz 1 se définit exactement comme pour 2 dimen- 


sions ({) 
On a : 
rune : 25 € 
= 0xÔ0yOz d Le Fe - <H, 0XxO0Y Ôz >= fÎf pan (x,y,2) (11) 


(1) Voir Féron, Sur les distributions de probabilité de Laurent Schwartz et certai- 
nes de leurs applications au calcul des probabilités. 
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Montrons que : 


05 H 


Théorè = 
Théorème es 


est la droite AG, 


Nous donnerons 3 démonstrations différentes de ce théorème. 


1/ Démonstration géométrique 


I suffit, somme toute de montrer que sur tout parallélépipède ne ren- 
contrant pas AG, I(° = JS] d H(x,y,z) = 0. Donc en définitive que le I() 


relatif à H est nul sur tout tel paral- 
lélépipède a bc def gh qui ne coupe 
pas AG.Ceci peut setraduire en disant 
qu'au moins une des projections du 
parallélépipède sur les plans £ A , 
EA6,QAË ne rencontre pas la pre- 
mière bissectrice correspondante , 
Supposons par exemple que abef se 
projette en a'b'e'f! et que a'b'e'f! ne 
rencontre pas AF. Alors si a''b''e''f!! 
sont les projections desmêmes points 
sur le plant CDH;Millestclair- que 
l'intégrale I étendue à abcdefgh 
est inférieure à la même intégrale 
étendue à a! b! e! a ! a!! b'! e'! f'! .On est 
donc ramené à un problème à deux 
dimensions dans le plan des £ . La fonction de répartition étant 
Min (£,7)=H (1) (£,7) quelle est la probabilité pour que le point M setrouve 
dans le rectangle a!'b'e!'f' ? Cette probabilité étant nulle, comme nous 
l'avons montré dans l'article cité précédemment, il en résulte que I(# = 0, 
DH 
0x0yOz 


donc que AG est le support de 


2/ Démonstration algébrique 


I1 suffit somme toute de traduire en langage algébrique la démonstra- 
tion précédente. Considérons le parallélépipède a bcdefgh comme 
défini par les 2 points a(£,,6) et g(£+AË£,7+A2,6+A6). Le fait que 
abcdefgh ne coupe pas AG se traduit par le fait qu'on ne peut trouver 
Atel que O0 X<I et que f HAAË=79+ XAM=E +AAË. Supposons par 
exemple que c'est la première de ces inégalités £ +AA€ = 7 + AA7quine 


PR DONS 2 me 
peut être RS da étant positive, on aura : 


De JS} Taa4 nt) 
O<I Se je JeH(x,y,2) I 
Or : 


11% = Min (£+AË,9+A7,1) - Min (£,?+A9,1) - Min (£+ &,7,1) + Min (£,9,1) 
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{Min (E+AË,1+A 7,0) - Min(£Ë,9+A7 ,0)- Min(£+AË,7,0)+Min(£,7,0) 
Min (£+A£,7+A%) - Min (£,7+A9%) - Min (£+AË, 7) + Min (6,7) 


= 0 


3/ Autre démonstration 


(Enter à 


G(x,y,z) (D=70G (6, y; 0) 12 
= 0XO0YOZ LE dXxO0Y (12) 
en appelant 12 la fonction (z) égale à 1 sur l'intervalle 0 1 à 0 ailleurs. 
(fonction caractéristique de l'intervalle O 1), e 
1 


Il en résulte que le support H G 
PG(x,y2) devra nécessairement être 
ÔxÔ0yOÔzZ 
contenu SEC produit de l'ensemble 
2 0 Gr, Vo) 
support de 2x5 et de l'inter- 
valle 0,1 porté par Oz. Dans le cas 1 
particulier de H(x,y,z), le support de D RS 
2 
PAGE est le segment de droite DG et l'ensemble produit de ce 
X 
support par le segment DA est le rectangle À F G D. On démontrerait de 
dŸH 
0xÔOyOz 
et dans le rectangle À B G H,. Ce support devra donc être tout entier 


même que le support de doit être contenu dans le rectangle ACGE 


contenu sur le segment de droite AG. Pour montrer que ce support est le 


segment AG lui-même, il suffit d'appliquer l'opérateur à une 


à x dy Ôz 

fonction ® (x,y,z) égale à 1 si 0OE<x << E+AËE<1 à O0 ailleurs et de 
3 

montrer que <a Sy 57 ,?>est différent de zéro et ceci quels que soient 


& et AE. En effet, pour une telle fonction ®, on a toujours quel que soit G, 
telle que G (E,0%,0) =E 


& £+af +00 f +00 
Es me il _ dG =Af (13) 


2°/ IL N'Y À PAS D'ÉLÉMENT MINIMUM 


lère démonstration 


En effet, supposons qu'il existe un élément minimum K(£,7, ic, 
c'est-à-dire un élément tel que K(E£,7,6)<G(E,7,6) pour tout G € E!,et 
quels que soient £,7,6 ;en particulier, on devra avoir : 


K(E, 7; co) LG(E, 7, co) 
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pour tout G € E';et quels que soient £ ? 
et7. C'est dire que dans l'espace 1 
2 dimensions K(£,7,c) devra être H G 
l'élément minimum des fonctions de 
répartition u(E,7) telles que @(E, 00) =£ 
(oo ;,n)=n. Cet élément est bien 
connu, On à K(£,7,œ)=Max(0,E+7-1) 
et nous avons montré dans l'article 


ee le support de la distribution 1 
dK(E,7,00) : D C 
DEF ETS est le segment de droite £ 


HC. Et comme précédemment on voit d'après (12) que le support de K 
devrait être contenu dans le plan HCEB,. 


En raisonnant de même sur K(c 9,6) et K(E ; ,6) on verrait que le 
support doit être tout entier contenu dans les rectangles DEFC et DBFH. 
Il en résulte que le support de K devrait nécessairement se trouver à 
l'intersection deces 3 plans, c'est-à-dire se réduire au seul point O centre 
du cube. Mais d'après (13) le support de tout G doit nécessairement couper 
le plan £=£, pour tout €, (0 <£, <1). On aboutit donc à une impossibilité, 
Ce qui prouve que notre hypothèse initiale est fausse, Autrement dit, il 
n'existe pas d'élément minimum, 


Autre démonstration 


Pour montrer qu'il n'existe pas d'élément minimum, il suffit de mon- 
trer qu'il existe au moins 2 éléments minimaux distincts. Or, il est clair 
que si nous avons pouruncertain K( (£,»,€), K® (£;9s0o0) = Max(0,£+7-1) 
on devra avoir la même relation pour tout g(E726) <K" (£:n,6). Il en 
résulte que le support de tout élément inférieur à K() doit être contenu dans 
le plan CHE B. Si nous imposons de plus à K (M (oo »] ,6) d'être minimum, 
c'est-à-dire que KM (oo ,),6) + Max (0,7+6-1), alors le support de tout 
élément 4 inférieur à K!( devra être tout entier contenu sur l'intersection 
des plans DECF et CHEB, c'est-à-dire sur la droite EC. Mais en vertu de 
13, il n'y a qu'une seule distribution K(Ÿ ayant pour support la droite EC . 
C'est la distribution telle que P(S) = _— . en FO EC cs 
il n'existe pas de fonction de répartition & inférieure à K{) et par consé- 
quent K') est bien une fonction de répartition minimale, On démontrerait 
de même que les fonctions de répartition K!? et K) ayant pour support les 
droites DF et HB sont aussi minimales, Il en résulte directement qu'il 
n'existe pas d'élément minimum. 


donc 


Remarque : Comme dans lecas bidimensionnel,toute fonction de répar- 
tition vx Ë,9, 6) qui vérifie en tous points les inégalités : 


Max [0,E+n+6-2] <Q(E,7,6)<Min (£,7,6€) 
a les marges voulues, La seule différence avec le cas bidimensionnel est 


que dans l'espace à 4 dimensions la surface séparatrice inférieure n'est 
plus une fonction de répartition, 


. II. CAS OÙ ON CONNAIT F(x,y,c) et F(,0,2z) 


Pour montrer qu'il n'y a en général ni élément minimum ni élément 


maximum, il nous suffira de donner deux contre-exemples sur le cube, 
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a) I n'y a pas d'élément minimum en général 
En effet, si nous prenons pour F(x,y,0) la fonction 
G(E,7)= Max (0,£+7-1) et Fo , co ,6) = £ pour 0 <£ <1 


alors il existe 2 fonctions de répartition minimales dont les supports sont 
HB et EC. 
b) Un'y a pas d'élément maximum en général 


En effet, avec l'exemple précédent, les 2 fonctions de répartition 
considérées sont aussi maximales, 


SUR LES DISTRIBUTIONS DE PROBABILITÉ 
DE LAURENT SCHWARTZ 


ET QUELQUES UNES DE LEURS APPLICATIONS 
AU CALCUL DES PROBABILITÉS 


par 


R. FERON 


SOMMAIRE : La distribution de probabilité de Laurent Schwartz est une 
sorte de densité de probabilité généralisée. 


On démontre en effet que Îa dérivée d'une fonction de répartition 
(prise au sens des distributions) est une distribution de probabilité au sens 
de Laurent Schwartz et que réciproquement toute distribution de probabi- 
lité est la dérivée d'une certaine fonction de répartition. De sorte que la 
définition de la probabilité de Schwartz est complètement identique à la 
définition classique de la probabilité comme fonction complètement additive 
d'ensembles, 

Nous verrons toutefois dans le cours dece travail qu'il est plus simple 
et plus intuitif pour la démonstration de certains théorèmes d'adopter la 
définition de Schwartz plutôt que la définition classique, On voit en effet 
mieux ce qui se passe en raisonnant sur les distributions plutôt que sur 
les fonctions de répartition. 

Ce théorème permet notamment d'étudier les couples aléatoires ayant 
des distributions marginales données, Certains d'entre eux sont définis 
par des distributions ayant leur support toutentier contenu sur des courbes 
que l'on définit d'une manière précise, 


PLAN DU TRAVAIL 

1°) Définitions fondamentales 

2°) Exemples 

3°) Généralisation à l'espace à n dimensions 
4°) Dérivées d'une Distribution 


5°) Application à l'étude des couples aléatoires dont les distributions mar- 
ginales sont connues 


6°) Application au problème de Bertaut. 
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1. - DÉFINITIONS FONDAMENTALES 


Laurent Schwartz (1) a caractérisé toute variable aléatoire X au moyen 
d'une certaine distribution particulière notée T ou T, et appelée par lui sa 
distribution de probabilité. Aussi après avoir rappelé brièvement la défi- 
nition des distributions de Laurent Schwartz indiquerons-nous en détail les 
conditions que doit vérifier une distribution pour lui conférer la qualité de 
distribution de probabilité. 


1. Définition des distributions de Laurent Schwartz 


Définition : On appelle distribution une fonctionnelle linéaire continue sur 


l'espace vectoriel D des fonctions indéfiniment dérivables à support borné. 


Cela signifie qu'à toute fonction y (x) indéfiniment dérivable (?) et nulle 
en dehors d'un intervalle borné (si x € R')ou d'un pavé borné (si x € R°) 
on associe un nombre noté T(y)ou<T,#> jouissant des propriétés sui- 
vantes : 


1°) T est une fonctionnelle linéaire, c'est-à-dire que : 
ÆT, PH T, pre T0, = 
et : Ab NX T,Q— 


2°) Test continu sur D, autrement dit <T,g>—<T,p>() si la suite de 

fonctions w; converge versw au sens de la pseudo-topologie de ©, c'est-à- 

dire si.: 

a) les y sont nuls en dehors d'un intervalle (ou d'un pavé) borné indépen- 
dant de j. 


b) les dérivées de tout ordre m des ÿ; convergent uniformément vers les 
dérivées correspondantes de w (*) 


(1) cf. Laurent Schwartz cours de MMP 1954 fasc. 4, p. 15. 
(2) Il existe effectivement de telles fonctions, par exemple p(x) = 0 se | > 
FE 


p(x)= e si|x| <1 
(3) Cette dernière définition est évidemment complètement équivalente à celle don- 


née par Schwartz dans son livre : Théorie des distributions (p. 21 et 24). Il dit en effet 
ceci : 


1°) Nous appellerons 2 l'espace vectoriel des fonctions 
f "ons < complexes p(x)=p(x,,.,. 
de n variables réelles indéfiniment dérivables à support compact à D pu 


2°) Une distribution T sera alors une forme linéaire continue sur 2. T(p) est conti- 
nue signifie que : Si des pje2 ont leurs supports contenus dans un compact fixe de R"' et 
si elles convergent uniformément vers 0 dans R'° ainsi que chacune de leurs dérivées 
alors les nombres complexes T(y;) convergent vers zéro, ‘ 


(4) On remarquera que Laurent Schwartz a imposé aux fonctions æ et à la pseudoto- 
pologie sur D les conditions les plus restrictives possibles, L'intérêt de ces restrictions 
tient dans le fait que 2 étant le plus petit possible son dual sera le plus grand possible et 
les théorème obtenus sur les distributions sont les plus généraux possibles, Il existe 
évidemment d'autres théories obtenues en remplaçant l'espace Dpar des espaces moins 
généraux, Telle est par exemple la théorie de la mesure où l'espace 9 est remplacé pa 
l'espace@ des fonctions continues, Les théorèmes obtenus à l'aide deces annee Se 


parfois plus puissants que ceux obtenus dans la théorie des distributions, Ils seront tou- 
jours moins généraux, © 


DISTRIBUTIONS DE PROBABILITÉ DE LAURENT SCHWARTZ 15 


II. Distributions de probabilité de Laurent Schwartz 


.. Laurent Schwartz attache à toute variable aléatoire (v.a) une certaine 
distribution Tx appelée sa distribution de probabilité (!) et qui devra être 
positive et telle que T, lLæ+r>= 1, 


Cette définition comporte les trois points suivants : 
a/ T est une distribution (voir définition plus haut) 
b/ La distribution T est positive. 


C'est-à-dire que pour toute fonction w(x)> 0 pour tout x le nombre 
<T,Y=est un nombre positif, 


T4 <T, l_ 0,400 >= 1 


Cette définition peut surprendre, attendu que l_+æfonction identique 
à 1 sur tout l'intervalle - ,+ n'est pas à support borné, 


Laurent Schwartz arrive pourvant à sa définition en se basant sur les 
théorème suivants : 


Théorème I.- Toute fonction continue X(x) à support (2) borné K, peut être 
uniformément approchée à € près quel que soit £ —0 par une fonction 
indéfiniment dérivable ÿ €9 et on peut astreindre ÿ{x) à avoir son support 
contenu dans un voisinage arbitraire du support K de X(x). 


Théorème Il.- (Fréchet (*)).- Si4(x) est une fonction mesurable, il existe 
une suite de fonctions Xj(x) continues qui pour j tendant vers l'infini conver- 
gent presque partout vers (x). 


Théorème III.- Si nous convenons de désigner par<f,9 >et=g,y=—les 
+00 + 00 
fonctionnelles f(x) p(x) ax, fax) @(x) dx (f et g localement somma- 


bles (4) et à part cela quelconques), 
Alors on ne peut avoir <f,Ÿ==< g, y >(1) pour tout y ED que si 


Pour prouver ce théorème Schwartz montre que : 


a) si (1) a lieu pour une suite de ÿŸ;j convergeant vers une fonction continue 
à support borné X, alors d'après le théorème I : 


VAT X(x) dx = fa) X(9 dx (2) 


(1) On notera que la définition de la distribution de probabilité de Laurent Schwartz 
ne coincide pas avec celle de la probability distribution des Anglo-Saxons, On peut toute- 
fois montrer que la connaissance de la distribution de probabilité de Schwartz entraine 
celle de la probability distribution et réciproquement, de sorte que le terme ne risque 
pas d'induire le lecteur en erreur. 


(2) Rappelons qu'on appelle support d'une fonction continue f(x) l'adhérence de l'en- 
semble des points x(de R' ou de R°) tels que f(x) + 0. 

(3) Le théorème II démontré par Lebesgue dans le cas des fonctions sommables a 
été démontré pour le cas des fonctions mesurables par Maurice Fréchet dans sa thèse. 


(4) C'est-à-dire sommables sur tout intervalle fini. 
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b) Si (2) a lieu pour une suite X; de valeur de X qui pour j tendant vers 


l'infini convergent presque partout vers une certaine fonction mesurable Ÿ 


alors : : : 
'£69 + 69 ax = 860) + (x) ax (3) 


Ces théorèmes conduisent Schwartz à définir le ‘prolongement analyÿ- 
tique" de ÆT,9> dans le champ plus étendu des fonctions continues à sup- 
port borné, puis dans le champ des fonctions mesurables à support borné 
et enfin dans le champ des fonctions mesurables à support quelconque et à 
adopter les définitions suivantes : 


a) On définit la quantité <T,X=— où X est une fonction continue à support 
borné comme la limite si elle existe, d'une suite de nombres :<T,> 
(CRREReE)E 


b) On définit le nombre<T,Y> où Ÿ est une fonction mesurable à support 
borné comme la limite si elle existe d'une suite de nombres=T,X;) — 


c) On définit <T,w>=où w est une fonction mesurable quelconque comme la 
limite si elle existe d'une suite de nombres <T, = 

En particulier, le fait que T,l-c+w>>= 1 signifie que si j'appelle 
lx,x, la fonction identique à 1 sur l'intervalle x,,x, nulle ailleurs (1), 


alors la limite de T,1,,x, == quand x, —»-coet x, — +0 existe et que cette 
limite est précisément égale à 1. 


Ceci étant, nous appellerons probabilité (2) pour que la v.a. X soit 
comprise entre deux nombres x, et x, la quantité : 


Pr Rx) <Tl,x, = (4) 


2. - EXEMPLES 


———__—_—_—__— 1 ——___—_—_—_—_—_—_—_—_—_—_______— 12 —_—_—————— 1 ——— 


< T,q>= = f f(x) q(x) ax (5) 
Alors on a les 2 propositions suivantes : 


1/ Si f est une densité de probabilité et si T peut être identifiée à f, alors 
T est une distribution de probabilité et (4) donne : 
X2 
LE REX <X2| = f(x) dx (5!) 
X; 

2/ Réciproquement si T est une distribution de probabilité et peut être 
identifiée à une fonction f, alors f est nécessairement une densité de pro- 
babilité et on a (5') 


b)Siona <T,w—=#(0)(6), alors Pr(X = 0) = 1 nous dirons dans ce cas 
que la distribution T peut être identifiée avec la distribution de Dirac (3)6, 
(1) dx, ,x, est souvent appelée l'indicatrice de l'intervalle x,, x. 


(2) On peut montrer qu'en vertu des hypothèses faites sur T la quantité définie par 
(4) est bien une probabilité au sens classique, 


(3) La distribution de Dirac Ô a été introduite par Laurent Schwartz pour éviter 
l'emploi de la fonction de Dirac Ô(x) qui est définie comme possédant les 2 propriétés 
mathématiquement contradictoires d'être nulle partout sauf pour x = 0 etd'être telle que: 


[2 360 àx = +1 
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c) Si on a <T,g>=Q(xi) (7); alors Pr(X = xi) = l;nous dirons alors que T 
peut être identifiée à la ''translatée!! d,i de la distribution de Dirac 6 et 
nous écrirons T =6,i, 


d)siona<T,p—=}p;9(x;)(8),alors Pr(X= xi) = p, etona T=}Xp. ô,i (8) 


——————_ —_—_—_——_—_—…—"’ "1% _—__—_———____———— _— 11 —_—_— 1 2 


une mesurep(x) si T,% >= fe(x) du(x) (9). 
Alors on a les 2 propositions suivantes : 


1/ Sip(x) est une fonction de répartition et si T peut être identifiée à la 
mesure u(x) alors T est nécessairement une distribution de probabilité 
et (4) donne : 


Pr(x! <X <x?) = (x?) - (x!) (9') 


2/ Réciproquement si T est une distribution de probabilité et peut être 
identifiée à une mesure U(x) alors (x) est nécessäirement une fonction 
de répartition et on a (9'), 


3. - GÉNÉRALISATION A L'ESPACE A 7 DIMENSIONS 


Nous pouvons généraliser à l'espace à n dimensions les résultats de 
Laurent Schwartz. A tout vecteur aléatoire X nous associons une distribu- 
tion T», X2°*"Xn positive et telle que : 


<T%, Xnrl(-00,-..-00),(+00,...+00) > = 1 (10) 


où L{- 00,00) ,(+00,- --+00) € St la fonction identique à 1 sur tout l'espace, 


Et nous appellerons probabilité pour que le vecteur aléatoire X soit 
dans le pavé x(x',..,. x"), ÿ(y',... y"), le nombre <T..s,166,..x7), (y. 


où Lx... x) (1...) est la fonction identique à 1 sur le pavé (x,y, à 0 
ailleurs, 

Avec cette définition de probabilité ,la fonction de répartition s'écrira 
évidemment : 


F(x) = <T = (11) 


81---En »1(-c0...-00),(xt...x") 


Ceci posé, Laurent Schwartz a montré (!) que : 


Théorème IV.- Toute distribution positive peut être identifiée à une mesure 
positive (2). 


(1) Laurent Schwartz théorie des distributions p. 28 th. V. 


(2) La démonstration de ce théorème fondamental est basée sur le fameux théorème 
de Riesz (C.R. 148, 1909, P. 974-6) qui dit qu'à toute forme linéaire <L , ÿ>continue 
sur l'espace € des fonctions continues, on peut associer une mesure bien déterminée et 
telle que <p , >= <L,9> 

I1 en résulte que pour montrer le théorème IV, il suffit de montrer que si T est une 
distribution positive le fait que les wj convergent vers 0 dans @ (c'est-à-dire sont tels 
que la suite des #j converge uniformément vers 0 ,mais pas la suite des g;j"’)entraine à 
lui seul que la suite < T,pj> converge vers 0. s 
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Du théorème IV résulte immédiatement : 


Théorème V.- Toute distribution de probabilités peut être identifiée à une 
Théorème V.- Toute distribution de probabintes, PER EE  —© 


fonction de répartition := T; g>=/9 (x) d F(x) 


Ayant donc montré l'intérêt de la définition de la probabilité de 
Schwarts, rappelons brièvement les quelques définitions et théorèmes 
fondamentaux qui nous sont indispensables pour travailler sur elle (t). 
Certains deces théorèmes (ceux relatifs aux distributions en général) sont 
classiques. D'autres (ceux relatifs aux distributions de probabilité) sont 


nouveaux, 


4. - DÉRIVÉES D’UNE DISTRIBUTION 


a) Théorèmes sur les distributions en général. 
1) Cas de l'espace à une dimension. 


À ; ; $ du 
Définition : La dérivée de la distribution T est la fonctionnelle S SA 
définie par : 


(p€2 ) (7). 


Les théorèmes suivants sont presque évidents : 


Théorème VI.- La dérivée d'une distribution est une distribution, 


s 


Théorème VII.- Si T peut être identifiée à la fonction f continue et dériva- 
ble en tous points, alors sa dérivée 2 peut être identifiée à la fonction f', 
on écrit alor L- = {! (13) et par abus de langage, on dit que si f est conti- 


nue, sa dérivée au sens des distributions est égale à sa dérivée au sens 
des fonctions, Ainsi, si une variable X possède une densité de probabilité 


cette densité est la dérivée de la fonction de répartition F(x) de x au sens 
des distributions, 


Par contre si la fonction F(x) présente des discontinuités sa dérivée 
f(x) = F'(x) au sens des distributions n'est pas identique à { F'(x)} distribu- 
tion identifiée à la fonction (3) égale à la dérivée (au sens de la théorie des 
fonctions ) de F(x) aux points de continuité, 


(1) Nous ne rappellerons ici que les définitions et théorèmes dont nous avons effec- 
tivement besoin. D'autres définitions sont encore plus fondamentales en calcul des proba- 


bilités comme celles concernant le produit de convolution de deux distributions et la 
transformée dè Fourier d'une distribution. 


(2) L'expression (12) reste évidemment valable si peD" ensemble des fonctions 


dérivables, pour certains opérateurs T particuliers (notamment si T peut être identifié 
à une fonction, 


(3) Dans cette théorie deux fonctions presque partout égales sont considérées comme 
identiques, 
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Exemple : Supposons que la v.a. X soit presque certainem:nt nulle, 
Dans ces conditions, sa fonction de répartition est la fonction de Heaviside 
Y (x) (lire Upsilon de x) telle que 


Y (x) = 0 si x <0 
(14) 
= 1 si x —=0 


À cette fonction correspond la distribution de Heaviside que par convention 
nous désignons aussi par Y(x) et qui est telle que : 


y (R); 0 >= / 40 dx 


I est clair que la distribution { Y'(x) | est la distribution identiquement 
nulle, c'est-à-dire que<| ÿ ca (x)}, p(x)> = 0 quel que soit y ED. Par contre, 
on peut montrer que : 


Théorème VIIL,- La dérivée de la distribution Ÿ (x) de Heaviside est la 
distribution de Dirac © (définie par (6)) : 
dc SS (16) 


Définition,- On appelle translatée de L de la distribution T, la distribution 
définie par : 


< Tes px) == <T,, 9 (x+L) — 
On en tire immédiatement le théorème suivant : 


Théorème IX.- Les opérations translation et dérivation sont permutables, 


On en déduit évidemment que la dérivée FE (x) fonction de répartition 
d'une variable aléatoire, presque certainement égale à xi n'est autre que 
ô,; translatée de la distribution de Dirac définie par (7), 


On conçoit donc que la fonction de Heaviside et la distribution de Dirac 
sont destinées à jouer un rôle capital en calcul des probabilités, Cette 
importance est encore accrue par le théorème suivant. 


Théorème X,.- RER F(x) a une dérivée F'(x) pou KR EN ECT 
et si on pose 


, alors la. dérivée de la distribu- 
tion F est la sirbution 


F'(x) ={ F'(x)] +D5P; Ô (17) 


2) Cas de l'espace à n dimensions 


Définition.- On appelle dérivée partielle de la distribution HOtecI OU 


: d'R7- : 
Tx,...x, Par rapport à x; la fonctionnelle définie par : 


ÔT | CA 
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Evidemment, on peut répéter sur cette dérivée partielle tous les 
théorèmes de la section précédente. - 


Naturellement, on peut considérer ensuite les dérivées successives 
é é AS dés : CM CML 
gi par exemple nous considérons l'opérateur de dérivation... 
P P P (ox, 1 "°° ox, 


alors on a 


CPR ET AL Neo) rex Bxpe 7 Vu 


Parmi tous les opérateurs de dérivation, il en est un destiné à jouer un 
rôle primordial en calcul des probabilités,c'est l'opérateur à _,,,d ,,,_d_ 

ù x4 dXp ÔXn 
que nous désignerons dans la suite par ou par ©, On a évidemment : 


Æ 


> Her. à 
DT, >= (-1) <T, (20) 


formule qui généralise (12). 


Il est clair que : 


Théorème XI.- Toute distribution est indéfiniment dérivable et que l'on 
peut intervertir l'ordre des dérivations ({}). 


On généralise aisément à l'espace à n dimensions la notion de fonction 
de Heaviside : c'est la fonction notée Y (x) ou Y(x,...x,) qui est égale à la 
fonction de répartition d'une variable aléatoire presque certainement nulle. 


On généralise aussi la distribution de Dirac et on appelle S(,, ou 
ÊGa...xr) la distribution telle que<ô,,.., ,9==#(0,...,0 et l'on aura : 
ai 


Le #0 5 (21) 
CETORRE 


Ÿ É 30e a) = Bugs 


ou sous forme condensée : 
d Y(x) 
Sen ON (21) 


La translatée sera toujours définie par 
Trop) >= <T,, 4 (x+1) = 


ER { 
X4eXnrP(X+X\, X2+Xh ee, Xntxl) > 

et nous noterons la translatée de Ô par 04..4 ou plus brièvement par ds, 

on aura donc ue: 


Æ ox P==p(r ns) 


(1) Une fonction £ (x) localement sommable apparait ainsi comme indéfiniment déri- 
vable au sens des distributions, Mais sa dérivée sera une distribution qui ne pourra être 
identifiée à une fonction que si f est suffisamment régulière; c'est ce qui fait que les 
d’f Cie us, 


fonctions dérivées de f au sens usuel peuvent être telles que 
x; ÔX9 dxz d X:1 


alors que 


pour les distributions dérivées on a toujours = Lao. 
ÔX1 OX VX? OX: 
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3) Support d'une distribution 


11 ———_]_—_—_—_—_—_—_—_—_—_—_—_—_—_—_—_—_—_—_——— —"* 


En particulier on peut montrer que le support d'une distribution de 
probabilité est le complémentaire du plus grand ouvert tel que : 


Pr (X € E)=0 pour tout, ECO 


Exemples : 


œ) Si f(x) est une fonction continue, la distribution f(x) aura pour support 
un ensemble fermé F qui est l'adhérence de l'ensemble des points x tels 
que f(x) 0 (x € R' ou de R"}), c'est-à-dire qu'il coïncidera avec le support 
de f considérée comme fonction, 


À) le support de Oxex, 2St l'origine 


y) dans R' le support de la distribution 2; p, 0; est constitué par les seuls 
points x = x!, 

o" aPn 

dx Pr SITES) xl) 


Théorème XII. - Le support S de la distribution dérivée it (ou 
est contenu dans le support de la distribution T, 


Ces deux supports ne sont d'ailleurs pas nécessairement identiques 
par exemple le support dela distribution de Heaviside est l'intervalle 0,+c0 
alors que le support de la distribution de Dirac Ô se réduit à l'origine. 


b) Thécrèmes relatifs aux distributions de probabilité 


1) Cas de l'espace à une dimension 


Nous allons prouver le théorème suivant : 


Théorème XIII.- F(x) étant une certaine fonction de répartition, la dérivée 
de la distribution E(x) est une distribution de probabilité, Réciproquement 


toute distribution de probabilité est la dérivée d'une certaine fonction de 
répartition, 


æœ) En effet, si F(x) est une fonction de répartition, EE, est une distribu- 
tion de probabilité. 


1°- la dérivée Æ de la distribution F est une distribution (théorème VI) 


dx 
2°- cette distribution est telle que : 
dF , DA dv 
genie 
+ co d 
= Fe F(x) dx (22) 


Mais comme par hypothèse le support de ® est un intervalle fermé ab (22) 
peut s'écrire : 
JF A dy? 23 
M de / F(x) = dx (23) 
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ab étant un intervalle borné et Y étant une fonction continue, les conditions 
pour que s'applique le théorème d'intégration par PUS de Saks (1) sont 
remplies et on a : 


<$ 19=>=- F(b+)y(b+) - F(a-) (a-) - fa d F(x)| 


b +00 
= /ste d F(x)= p(x) d F(x) (24) 


a 


et sous la forme (24) il est évident que si y € D est positive <E E, 9 >œle 
sera aussi, 


3°- Si la suite des witend vers la fonction continue X(x) à support 


+00 


borné comme il est dit dans 1°, il est clair que w(x) d F(x) tendra vers 


X (x) d F(x). 


— CO 


+ co 


Si ensuite la suite des fonctions continues X:(x) converge presque par- 


+ co 
tout vers la fonction la,b, il est clair que/ X;(x) d F(x) convergera vers 


b As 
7 d F(x) = F(b) - F(a). 


Enfin quand b-.- et a— -, F(b) - F(a) —1 


donc : <T » lo, too >= 1 


ce qui achève de démontrer la première partie du théorème, 


8) Réciproquement, montrons que toute distribution de probabilité est la 
dérivée d'une fonction de répartition, 


Soit en effet T une distribution de probabilité, D'après le théorème IV, 
il existe une mesure positive LL(x) telle que : 


b 
<T, Ÿ >= / #60 au (x) (25) 


Il 


b 
d $ 2 
- fat dx d'après le théorème de Saks 
a 


5 dy 
re 
d 
it > 
donc : T - 4 
dx (27) 


(1) Saks. Théorie de l'intégrale (p, 102 de l'édition anglaise). 
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Entoutretde (25), et.du, fait.que TMS TS Poonrdédüitique 
+00 
f du(x) = l, ce qui achève de démontrer le théorème puisque u est déter- 
— 00 
miné à une constante additive près. 


Cas de l'espace à n dimensions 


Théorème XIV.- F(x) = F(x,, x,,..., x) étant une certaine fonction de 
répartition, la l'dérivée!! tend 2... de la distribution F(x) est une 
Ô Ô x D Xp dXn 


distribution de probabilité dans R", 


Réciproquement, toute distribution de probabilité T dans R'" est la 
’dérivée'' d'une certaine fonction de répartition, 


Ce théorème se démontre exactement de la même manière que le 
précédent, 


Ceci posé, nous avons maintenant les éléments de base nécessaires 
pour traiter les applications que nous avons en vue, À cet effet, nous 
modifierons un peu nos notations et appellerons désormais F(x,y) la fonc- 
tion de répartition du couple aléatoire XY. 


5. - ÉTUDE DES COUPLES ALÉATOIRES DONT LES DISTRIBUTIONS 
MARGINALES SONT CONNUES 


Considérons donc un couple aléatoire XY dont la distribution T,kyest 
inconnue, mais dont on connait les distributions marginales R, et Sy. 


Divers problèmes se posent à propos de ce couple. 


a) Quelle relation y a-t-il entre Rx, S, et Rx, ? 
On a évidemment 
Théorème XV, -1R\=< Tr l_coÿrss (28) 


En effet, la fonction de répartition F(x,y) ducouple XY est donnée par : 


FR) = < Ts LC o,+o) (> (29) 

la fonction de répartition marginale de la v.a. X vaut donc : 
F (xe)= Tes LCo0,+00);(x,+00) (30) 
pt 1-co,+00> 1 _,x— (31) 


Mais on a aussi : 
F (x, 0) = <R4; l_o,x— 


ce qui démontre (28). 
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b) Distributions T;, remarquables 
Ceci posé Maurice Fréchet (*) remarque que d'une part on a toujours : 
F(#,y) < Min | F(x,c0), F(00, y) | (32) 
et d'autre part : 


F(x,y) > Max | 0, 1- [1 _ F(x,00)]-[ 1 - F(0,y)] | 


Z Max | 0, F(x,0) + F(o,y) - 1} (33) 

et il a montré que les fonctions : 
Fr (x,y) = Min | F(x,0œ), F(o,y)} (34) 
F@) (x,y) = Max | 0, F(x,c) + F(c,y) - 1} (35) 


étaient effectivement des fonctions de répartition et définissaient dans le 
cas où X est une v.a, discrète et dans le cas où les fonctions de répartition 
marginales sont continues, ce qu'on peut appeler des liaisons statistique- 
ment non décroissantes et statistiquement non croissantes, Nous nous 
proposons ici de donner une autre démonstration des théorèmes de Fréchet, 
démonstration qui a le mérite de préciser ce qu'il faut entendre par liaison 
statistiquement croissante (décroissante) dans lecas général. Considérons 
donc la fonction F1) (x,y) définie par (3) et cherchons s'il existe une dis- 
tribution de probabilité telle que : 


=? 1(-00,-œ), x y=>= Ft) (x, y) (36) 


la démonstration comprend 3 points, 


1°) Il existe une distribution vérifiant (36) : 


à F (1) (x; y) 
MR 


1 (DE 
c'est Txy= 8x 0y 


2°) Cette distribution est positive, en effet : 


or) 3 (1) à? 
re HAS CARRE FT > 


à? 
=] k Cyr & dy 


Or FU) étant à variation bornée, on peut appliquer le théorème de 


Saks, il vient : 
dr 
Dee con ne g>= /Jea FU(x,y) 


et sous cette forme, on voit i iti o"FUU iti 
3 que si p ED est positive 5x dy est positive 


puisque l'élément d'intégration 4 F(!) l'est (comme on levérifie sans peine) 


(1) Matrice Fréchet, Sur les tableaux de corrélation dont les ma d é 
Ann, Univ. Lyon, 9, 1951, p. 53-7. Eggs ie 
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ee etes <T;, s L{-00,-00) fe a +00 Ed (#00 + 00) 


= Min | Fo ; c) , Fc; c) | 


= ] 
Nous avons donc démontré que re est bien une distribution de proba- 


bilité. Nous nous proposons maintenant de chercher le support de cette 
distribution, 


À cet effet, remarquons que le plan peut être séparé en 2 régions E; 
et E, telles que l'on ait : 


pour E, F(x;,©œ) >F(,y) 
pour E; - F(x;œ) <F(,y) 


Soient E', et E',les plus grands ouverts contenus dans E, et E», @, leur 
frontière. Nous nous proposons de montrer que le support de Tf}, est tout 
entier contenu dans €,, Pour cela, il suffit de montrer ne quelle que soit 
[0 ED et ayant son support dans E', ou dans E'ona Ty >= 0. Suppo- 


sons d'abord que ® a son support dans E}, alors on a : 


2 (1) ) 
(1) 4, dot + L'SF.. 24 
MDN LPO) VPN Tor 
(1) 
mais sur E!, F ®(x,y) = F(c,y) la dérivée LE au sens des fonctions 


existe donc et est nulle, à distribution pourra donc être identifiée à la 
fonction nulle, donc <Txy» ÿ>>= 0. On verrait de même que si ÿ a son 
support sur E! ns 

FU) (x,y) = F(x,c) 


et (1) 
to {se die das 
<T,;yL== - 3y. 3x = 0 


ce qui démontre le théorème, 


Il est aisé par ailleurs de voir que la courbe ©, peut être représentée 
par une fonction non décroissante de x, 


Pour le prouver, il suffit de montrer que si x,y, est un point de E;, 
x y, est aussi un point de E; pour tout x x, autrement dit que si on a : 


F(x9»©%) >F(0, yo) 
on a aussi F(x, ©) > F(00, y) pour tout xx) 


ce qui est évident. 
Généralement d'ailleurs le support de y ne coincide pas avec és Si 
par exemple les v.,a, marginales sont discontinues et susceptibles de pren- 
dre seulement les valeurs x; y, on aura : 
De = à 
L 
S y = 3 Ô,; P; 
Try PTE On 
El) 
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où les Pi; représentent les sauts aux points xi yj de la fonction : 
F (1 (x,y) = Min { F(x, 00), F(:y)} . 


Dans ces conditions, le support de T,, est évidemment constitué par 
les seuls points x' yi de Es pour lesquels Pi; A0, 


Cette dernière remarque nous conduit à essayer de déterminer exac- 
tement quel est le support de T{) connaissant Rxet Sy. Soient À le support 
de Rxet B le support de Sy, on peut démontrer le lemme suivant : 


Lemme.- Le support de an est constitué par l'ensemble des points de C, 
qui appartiennent à l'ensemble AxB, 


Par ailleurs, il est aisé de voir qu'il existe une distribution de proba- 
bilité TŸ} telle que (35) soit vérifiée et que cette distribution a son support 
tout entier contenu sur la courbe €, définie par une certaine fonction non 
croissante (Pour le voir on peut, soit reprendre pas à pas la démonstration 
précédente, soit plus simplement se ramener au cas précédent en remar- 
quant que (35) peut s'écrire : 


Fo,y) - F(x,y) = Min | LAC à Foi à F(x; ce) } 


ou Pr ! Si Y<Y} = Min | Pr(y £Ÿ), Pr(x > x)| 


évidemment on ne pourra avoir ne = nn. que si ou bien il existe une valeur 
xpde xtelle que R,y = dx, ou bien il existe une valeur Vo de ytelle que 
Sy = (VA ,; c'est-à-dire si l'une des variables aléatoires XY est presque 


sûrement constante, 


Les résultats dece paragraphe sont résumés dans le théorème suivant : 


Théorème XVI.- 


1°- Hexiste en général une infinité de couples aléatoires XY de distribution 
de probabilité T,x;y, admettant des distributions marginales R;, Sy connues 
(Il n'en serait autrement que si on peut trouver xçou y, telles que l'on ait 
ou bien R,= ô ou bien Sy-= Ôy, }s 


2°- Si nous ordonnons l'ensemble E des T;yen convenant de dire que 
Days, si F'(cYy)S F''(x,y) quels que soient x et y l'ensemble E a un 


élément maximum Try et un élément minimum FE 


3°- Le support de Te est tout entier contenu sur une courbe €, qui peut 
être représentée par une fonction non décroissante et de même le support 
de ne) est tout entier contenu sur une courbe @, qui peut être représentée 
par une fonction non croissante, 


6. - APPLICATION AU PROBLÈME DE BERTAUT 


Dans une note aux Comptes Rendus (1) J. Bertaut dit ceci (textuelle- 
ment aux notations près) : 


Définitions : Soient n variables stochastiques Are NICt SOLE 
dx = dx' dx? dx” la probabilité élémentaire définie de telle sorte que : 


{ 1 { 1 
[axe fax = 10e. JE (ee > a | 
0 Q 0 : 


(1) J. Bertaut. Sur la probabilité de valeurs de fonctions, Applications à la cristal- 
lographie. C.R. 10 janvier 1955, p, 152, t. 240. 
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Soit d (z-a) la fonction de Dirac nulle pour z + a infinie pour z = a et telle 
+ co 


que d(z-a) dz = 1 (37) 


— OO 


__ Soit enfin une fonction Ÿ (x3,..., Xh) prenant toutes ses valeurs dans 
l'intervalle 0 x; 1 (j=1,,..n), elle peut être zéro à l'extérieur de 
l'intervalle ou encore être périodique. 


Théorème,- La probabilité P(y) dy pour que la fonction (X.,.,X:) des n 
variables indépendantes X;j prenne des valeurs comprises entre y et y + dy 
est telle que : 


1 n 
P(y) = fo (y TT, dx; (38) 


Outre que nous n'admettons pas l'existence de la fonction de Dirac 
l'intégrale (37) étant évidemment nulle, Nous voyons mal comment on peut 
en appliquant (38) trouver une évaluation correcte de la densité de proba- 
bilité P(y). Monsieur Bertaut ne dit pas comment il s'y est pris pour 
démontrer son soi-disant théorème, Ilest probable qu'il a remarqué que 
si le couple aléatoire XY a une densité de probabilité, si de plus X est 
uniformément réparti sur le pavé 0 1, et si enfin Y est en corrélation dure 
(1) par rapport à X, la densité de probabilité liée f,(y) est de la forme 
ay -9(x)] et la densité de probabilité de y est : 


f(y) = JL = d (x)] Le dx; (39) 


et il est probable que de (39) il a inféré (38). 


Il est aisé de mettre (38) sous une forme rigoureuse, On a : 


Théorème XVII.- Ladistribution T, dela variable aléatoire: Y =4(X,...X;) 
est telle que <T,y,p(y)=—=<<Æ ôpP(y) > 101 > où Los désigne la fonction 
identique à l sur le pavé (0,...,0),(1,...1). 


On peut démontrer ce théorème, soit en passant par les fonctions de 
répartition en utilisant la formule : 


F(00 :y) =// FA(y) dx 


soit plus simplement en utilisant le théorème de Schwartz sur la conver- 
gence d'une suite de distributions f;(y) vers la distribution 6. 


(1) Pour la définition de la notion de corrélation dure, voir S. Bernstein, Fonde- 
ments géométriques de la théorie des corrélations. Metron 1928, 


PRODUIT DE FONCTIONS 
CARACTERISTIQUES 


ET INDÉPENDANCE DE VARIABLES ALÉATOIRES 


par 


M. GIRAULT 


OBJET DE L’ÉTUDE 


On considère les variables aléatoires X, Y et Z = XY et soient 
Px(t), Py (t); z (t) les fonctions caractéristiques associées, On sait que si 
X et Y sont indépendantes : Ÿ,(t) = Y,(t) Y,(t). Nous voudrions attirer 
l'attention sur Le fait que la réciproque n'est pas exacte ; et plus générale- 
ment sur le fait que les lois de répartition de X ; de Y (lois marginales) et 
de (X+ Y) ne déterminent pas complètement la loi du couple (X,Y). 


On notera en particulier que si X, Y et Z suivent des lois du GE re 
net (n; +n,) degrés de liberté, cela n'entraine nullement l'indépendance 
de X et de Y,. 


DÉVELOPPEMENT 

Soit donc le couple aléatoire (X,Y}) et désignons par Fo et G(y les 
fonctions de répartition marginales de X et de Y. 

Si les variables X et Y sont indépendantes, la fonction de répartition 
H (2) de Z = X+Y est obtenue par produit de composition de F{,, et de G{,,. 
(1) H(z) = F(x) *G(y) soit H(z) =/ r(z-y) d G(y) 


D'autre part un résultat maintenant classique (1) nous apprend qu'ilya 
équivalence entre la relation (1) et la relation (2) suivante pour les fonc- 
tions caractéristiques : 


(2) P.(t) = Pit) Q(t) 


Si brs=E sa SL est la f.c. du couple (X,Y}), la relation (1) 
entraine (3 : - 


(3) ® (tt) =®(t,0). ® (o;t) 


(1) Voir H. ROBBINS. Mixture of distributions, Annals of Math, Stat, Vol XIX, n°3 
Sept, 1948, p. 365 ; et M. GIRAULT. Les fonctions caractéristiques et leurstransforma- 
tions, Publications I1.,S.U .P. 1955, 
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puisque ,(t) = ®(t,t) et que les f. c.des distributions marginales sont 
®(r,;0) et ® (0,5) 

Réciproquement, la relation (3) entraine (1) mais elle n'implique pas 
l'indépendance de X et de Y. 


La condition nécessaire et suffisante d'indépendance de X et de Y 
relativement à ®(r,s) est 


(4) ® (r,s) = D(r,0). D(o,s) 


et cela pour toutes les valeurs de r et de s, Or la relation (3) indique 
seulement que (4) est satisfaite sur la droite r = s et non dans tout le plan. 
Il n'y a donc pas nécessairement indépendance stochastique. 


En d'autres termes, on peut avoir la relation (1) pour certaines dis- 
tributions de variables liées, 


En effet, partons d'une répartition de v.a. indépendantes X et Y ; les 
fonctions de répartition de X de Y et de X + Y réalisent 


Her 0 


Ajoutons une ‘'pseudo répartition! de masses positives et négatives 
réalisant les conditions suivantes : 


masse nulle sur tout intervalle À x 
I LA] 11 LA! 1f LA JUN, y 


11 it 11 ut 11 À (x + y) 


De plus, on imposera à la nouvelle répartition d'être partout à mesure 
positive. 


Il est bien clair que la nouvelle répartition admet encore F, G et H 
pour fonctions de répartition de X de Y et de (X + Y) et par suite on a 
encore : H=F *G d'où Y,(t) = @(t) p,(t) 


Ilest facile de montrer que réciproquement, si une distribution réalise 
H=F*G, elle est la somme d'une distribution de v.a, indépendantes et 
d'une distribution de masses réelles réalisant les conditions (I). 


Des exemples ont été donnés par H,. Cramer (Mathematical Methods 
of Statistics 1946, Exercice p.317, n° 2) et H. Robbins (Annals of Math, 


Stat. Sept. 1948). Dans ces exemples les conditions indiquées ici sont 
réalisées très simplement, 


Voici à titre d'illustration l'exemple de H, Robbins : 
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or à uniforme de densité 2 dans les parties hachurées du carré 
fig. I). 


Les répartitions de X de Y et de Z sont les mêmes que celles données 
par une répartition uniforme dans tout le carré, 


Ajoutons que la transformation indiquée par les conditions I est tou- 
jours possible dès que les répartitions de X et de Y ont au moins trois va- 
leurs possibles : x , X,, X35 Y » Y2» Y3» réalisant : 


Ko) 2501 
Ka 2 0) 2 


A partir de la répartition indépendante, on ajoutera aux points (x;y;) 
les masses o, +c ou -c conformément à la figure II. 


X 
de 


où cæ min, prob | A AQU 


Yi 


Si la distribution est continue, les points (xiy;) seront remplacés par 
des éléments dx dy et c par une densité, 


En résumé les relations (1) ou (2) entrainent l'indépendance dans le 
seul cas où X et Y ne peuvent pas prendre l'un et l'autre au moins 3 valeurs 
ayant deux à deux des différences égales, 


| 
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DES POSITIONS TYPIQUES D'UNE 
VARIABLE ALÉATOIRE 


par 


Saad K. NASR 


1. - INTRODUCTION 


Une définition de la moyenne d'une variable aléatoire située dans un 
espace de Banach à été donnée par Mourier (9). D'autre part, une seconde 
définition de cette moyenne a été exprimée dans Espace métrique par 
Doss (2). On sait (10) qu'une moyenne dans le sens de Mourier, si elle 
existe, est aussi une moyenne dans le sens de Doss, Fréchet (3), généra- 
lisa la définition de la moyenne de Doss en vue de définir les positions 
typiques d'une variable aléatoire située dans un espace métrique (ses 
positions : moyenne, centrale, équiprobable, dominante, etc.,..),. 


Nous définirons sous la définition -2-, dans les conditions les plus 
générales, les positions typiques d'une variable aléatoire quelconque de 
telle manière qu'une position typique existant dans le sens de Fréchet, 
sera aussi dans notre sens une position typique (proposition 2). 


2, 


Soit (fi)iex une famille de fonctions numériques (finies) définie sur un 
ensemble X , telle que pour deux éléments différents x et y appartenant à 
l'ensemble, il existe un i € I pour lequel f;(x) 4 fi(y). On définit alors une 
structure uniforme séparée ( (1), Ch. IX, parag.$l) sur X par la famille 
(gi) des écarts gi(x,y) = | fi(x) - fi(y) |. Inversement, étant donnée une 
structure uniforme séparée sur X , une famille d'écarts est alors définie 
sumX4(0(l),1Ch, IX;tparag/$l): 


2.1. Plus généralement étant donnée une variable aléatoire X située dans 
l'ensemble X, on supposera qu'une structure uniforme séparée est définie 
sur X par la famille d'écarts finis di(x,y) avec i € I. La classe K des 
transformations 


da(x) = d(i,a (x) = di (x,a) (1) 


définie dans X pour toute paire d'éléments a ={i,a) avec i € I et a élément 
fixe de X, est alors une classe séparative ( (8), p. 29). 
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Définition (1) 


LA CLASSE K DE TRANSFORMATIONS dx), définie sous le paragra- 


phe 2,1. est appelée classe séparative de transformations métriques. 


O1 écrira par la suite T(N) pour la position typique d'un nombre aléa- 
toire N en supposant que pour tout «, da(X) est un nombre aléatoire pour 
lequel une position typique T(da(X) ) existe. 


Définition (2) 


d'une variable aléatoire X située dans un ensemble X, s'ilexiste une classe 


séparative K = : da(x) Ï avec x€ X de transformations métriques, de telle 


manière que l'on ait 
da(t(X))  T (da(X)) ; PAIE à 


indépendamment de &. 


2.2, Considérons la variable aléatoire X située dans un espace métrique (D) 
défini par la distance d. Un élément *x € (9) est une moyenne dans le sens 
de Doss (2), si pour tout élément fixe a € (2) on a d(x,a) <Md(X,a) oùM 
indique la moyenne classique d'un nombre aléatoire. Or K=(d«(x)) = (d(x,a)) 
étant une classe séparative de transformations métriques, on voit que 
toute moyenne dans le sens de Doss, est moyenne dans le sens d: notre 
définition (2). D'où, plus généralement : 


PROPOSITION I 


TOUTE POSITION TYPIQUE D'UNE VARIABLE ALEATOIRE X DANS 
LE SENS DE FRECHET (3) EST UNE POSITION TYPIQUE DE X DANS LE: 
SENS DE LA DEFINITION (2). 


2.3. Afin de justifier la condition que la classe K soit nécessairement une 
classe séparative, nous donnerons l'exemple suivant : 


Soit une classe K définie par le seul écart g(x,y) = | f(x) -£(y)l où 
-X pour 0 
i ) 0 pourul 10H 2 
x-2 pour Xe 22 


Pour une variable aléatoire X qui prend les valeurs N, 1 et 2, avec 
une probabilité égale à 1/3 dans chaque cas, on a 


De UX a) 7241) pour tout a réel, 


Autrement dit, la moyenne classique x = l de la variable aléatoire X 
n'est pas l'unique solution de l'inégalité 


g(T,a) <Mg(X,a) 


puisque celle-ci est satisfaite par tout élément t dans l'intervalle (0,2), 
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3. - 


Considérons à présent la variable aléatoire X située dans l'espace de 
Banach (X). Unélément x € (X) est une moyenne dans le sens de Mourier (9) 
si l'égalité 


x* (x) = M (x*(X)) (1) 
est satisfaite pour toute fonctionnelle linéaire continue x* définie dans (X). 


3,1. On sait que (10) toute moyenne dans le sens de Mourier est aussi 
moyenne dans le sens de Doss, d'où, d'après la Proposition I, elle l'est 
aussi dans le sens de la Définition (2). D'ailleurs ceci peut être prouvé 
directement comme suit : 


PROPOSITION II 


LA MOYENNE DE MOURIER D'UNE VARIABLE ALEATOIRE X € (x), 
si elle existe, EST AUSSI UNE MOYENNE DANS LE SENS DE LA DEFINI- 
TION (2). 


En effet, pour n'importe quelle paire d'éléments distincts x et y de (X), 
il existe ((6), p. 19) une fonctionnelle linéaire x* telle que 


Pe*Ge-y) [= [x-y > 0 (2) 
On peut donc dire qu'il existe un écart d*(x,y) défini par 
d* (y) = fx Go - x* (5) (3) 
tel que l'on ait 
dy) he) xt (y) | = Pay) | 0 
D'où la famille des écarts {d*{(x,y)}={[x*{x) - x*(y) | } où x* appar- 


tient à l'espace (X*) conjugué ( (6), p. 21) de (X), définit une classe de 
transformations métriques. 

Si x € (X) est une moyenne de Mourier d'une variable aléatoire X, on 
aura de l'égalité (1) 


x* (x) - x* (a) = m(x*(X) - x* (a)) (4) 
indépendamment de a € (X). 


De (3) et (4)on a 
d*(x,a) = | M(x*(X) - x*(a) | < M d*(X,a) (5) 


ce qui démontre la proposition 


3.2. LA DEFINITION DE FRECHET DE LA MOYENNE D'UNE VARIABLE 
ALEATOIRE X SITUEE DANS L'ESPACE DE BANACH ((2), parag. 5) 


Dans ce qui suit, E dénote l'ensemble d'évènements élémentairesE, 
d'apres la terminologie de Kolmogoroff (7). Une variable aléatoire X est 
dite appartenir à la classe (IF), si quelque soit e>0, on peut trouver une 
décomposition A(=A,,) de l'ensemble E en une suite dénombrable d'en- 
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sembles disjoints probabilisables e:, e:,... (E = U, (e.) ) pour laquelle la 
condition suivante est satisfaite : , 


{p (er) = Prob.(e,) = 0 ou rex [rx - vx [<< jore12s(i) 
de telle façon que la série 
co 
Te = 2, p (er) | FX | , $£er, (ii) 
soit convergente, 
Si la sommew. existe pour au moins une décomposition A.x, elle 
existe pour toute autre décomposition A&x, (2). 


L'espace de Banach étant complet, quand € —0, la limite de 
Se = Lpe),x “= ces (iii) 


existe indépendamment de A,,. Cette limite I(X) est la moyenne (IF) de X. 


Si l'espace (X) est un espace de Banach séparable, une telle décompo- 
sition À satisfaisant (i) est équivalente à l'affirmation que X est presque 
sûrement contenu dans un sous-ensemble séparable (X;,) d'un espace de 
Banach X. 


On sait que si (10, Théorème 3) la variable aléatoire X de la classe 
(IF) est faiblement mesurable ((6), p. 36), la moyenne I(X) est aussi une 
moyenne dans le sens de Mourier, Il en découle de la proposition II la 


PROPOSITION III 


SI LA VARIABLE ALEATOIRE X DE LA CLASSE (I,F) EST 
FAIBLEMENT MESURABLE, LA MOYENNE I (X) EST AUSSI UNE 
: MOYENNE DANS LE SENS DE LA DEFINITION (2). 


4. - 


Il est important de savoir si une position typique t (X) d'une variable 
aléatoire X existant relativement à une classe K, dans le sens de la défini- 
tion (2), existe de même relativement à une autre classe K,, où K,et K, 
sont deux classes séparatives de transformations métriques, seules trans- 
formations prises en considération par nous, 


4,1. L'exemple suivant montre que cela n'est pas toujours le cas. 


Soit le nombre aléatoire X prenant les valeurs x, et x, (x, £ x,) avec 
les probabilités respectives p et q(p+q = 1). Considérons les deux classes 
K, et K) définies respectivement par les deux distances d, et d, avec 


di (x,y) = [x-y| 


et d2(x;,y) = 0 si X = y 


= ] OEESA 


On a alors di (X,x1) = L où X = px, + qxr, la moyenne classique de X. 
Comme M d(X,x) = q, d(X,x,) > M d,(X,x,). Ceci montre que la moyenne 
classique X, qui est une moyenne dans le sens de la définition 2, relative- 
ment à la classe K, n'est pas une moyenne relative à la classe K>. 
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En particulier, on remarque qu'une moyenne dans le sens de Doss rela- 


tive à une certaine distance, n'est pas nécessairement une moyenne dans 
le même sens relative à n'importe quelle autre distance. 


4.2. Etant donnée une famille (fi);er d'écarts sur XX, soit gx. l'enveloppe 
supérieure de la famille (fi);ien , où H est une partie finie quelconque de I. 
La famille d'écarts (gy.) est équivalente ((1) Ch. IX, parag. 1) à la famille 
(fi); on dit que c'est la famille d'écarts obtenue en saturant (f;) et que (gu.) 
est une famille d'écarts saturée, 


Définition (3) 


Soient K,_et K; deux classes différentes définies par les deux familles 
saturées (f;)ier et (g)xex sur le même ensemble X, Si U,et U, sont les 
deux structures uniformes induites par (f;) et (gx) respectivement, on dit 
alors que K, est moins fine que K2, si U; est moins fine que U:. K1 est dite 


Li gx. 


4,3. Soit (X) un système linéaire ((6) p.9) sur lequel on définit les deux 
classes K, et K, comme suit : 


Ken f} 
K:={d(xa) EI ,a € (X), (1) 


où |x |est la norme de x, (di) la famille d'écarts saturée telle que pour 
tout i, étant donnés des éléments x,, x, Y1, y de (X) on ait : 


di(xit+x2, y1 +y2) di (x1,y1) + di(x2s y2) 
di(kx, ky)<|k|di(x,y) 
pour tout nombre réel k. 


Remarque : Nous entendons par position typique d'une variable aléatoire 
celle admise dans la définition (2), sauf affirmation contraire, 


PROPOSITION IV 


SOIT X UNE VARIABLE ALEATOIRE SITUEE DANS UN SYSTEME 
LINEAIRE (X), SUR LEQUEL ON À DEFINI LES DEUX CLASSES K; ET K: 
INTRODUITES PAR LES RELATIONS (1) CI-HAUT. SI K2EST MOINS 
FINE QUE K;, ET SI L'ON SUPPOSE QUE M(da(X)) EXISTE INDEPEN- 
DAMMENT DE a=({i,a), TOUTE MOYENNE (IF) DE X EXISTANT RELA- 
TIVEMENT A K; EST AUSSI UNE MOYENNE RELATIVE A Ko. 


En effet la classe K, étant moins fine que K,, pour tout écart di et tout 
e >0 ((1) Ch. IX, parag. 1), il existe un € > 0 tel que 


Ix-y| ie implique dji(x,y)<e' (2) 


La variable aléatoire X étant de la classe (IF), on peut dire de (3.2.) 
que pour tout e>0, il existe une décomposition Akx de E en une, suite 
dénombrable d'ensembles disjoints probabilisables e1, e:,... (E = U, (er) ) 
pour laquelle la condition (i) de 3.2, est satisfaite. : 
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di étant un écart, de (2) on obtient 


max |di(gx,a) - di (ex,a)|< max di Gare #'oia (3) 


pour tout élément fixe a de (X). 


De (3) et de (i) de 3,2. on voit que pour tout €’ 0 il existe une décom- 
position AYx(=A.x) de E en une suite dénombrable d'ensembles disjoints 
probabilisables €, e:,...(E=Ù, (er)) ; pour laquelle la condition 


{ p(er) #0" ou max di(çx,a) - di (x,a)< €’ hr = 1,2,... (4) 


est satisfaite. 
n n 
Posons s{= 2 p(er)g.x tin. Aù se 2,p(er) (5) 
F= = 


s 


Avec les conditions imposées à K2 on obtient : 
n n 
di(s® , 40) = di(Dip(er,x , 2,p(er) . a)< 
< Xdi(p(erh,x, pler).a)< 2, p(er) di(x,a) (6) 


Comme la série (ii) de 3.2. est convergente, on a 


ne (e fixe) (7) 
On a de plus 
la-a9 121 pts lslalÈpte)—0 as na (8) 


La topologie définie par K, étant moins fine que celle définie par K,, 
on a des relations (7) et (8) 


Lire di(sé,s)= lim di (a »,a) = 0 (9) 
Or di est un écart 
[di(s® , a® )- di(se,a)| <di(s{ ,s,) + d;(a® ,a) (10) 
Le passage à la limite n—>œ dans l'inégalité (6), et de (9) et (10) il découle 
di(se,a) = lim di(s{ a )< lim Ds p(er) di(çx,a) 
= ); p(er) di(çx,a) (11) 


Comme lim se = I(X) (de la relation (iii) de 3.4.), relative à la topologie 
définie par K:, alors quand e'—>0, (11) donne 


di(1(X),a) <lim 2 p(e-) da (x) » _K£er, 
: a=(i,a) (12) 
Or M d(X) existe pour tout a=(i,a), I(4{X)) existe ((2) parag. 5) et 


égale M da(X). Ceci entraine que le membre de droite de l'inégalité (11) 
existe et admette pour limite Md,(X) quand e —0, 


Cd te dr 
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4,4, Nous donnons ici un exemple important de classes K, et K, satisfaisant 
les conditions (1) de 4,3. 


PROPOSITION V 


SOIT X UNE VARIABLE ALEATOIRE SITUEE DANS UN SYSTEME 
LINEAIRE (X) SUR LEQUEL DEUX CLASSES K, et K, SONT DEFINIES 
RESPECTIVEMENT PAR LES NORMES ||xl, ET xl,. SI K EST MOINS 
FINE QUE K,, TOUTE MOYENNE (IF) DE X EXISTANT RELATIVEMENT 
A K3 EST AUSSI MOYENNE RELATIVEMENT A K, AVEC LA SUPPOSI- 
TION QUE POUR TOUT a € (X), dé(X) =| X-al, SOIT UN NOMBRE 
ALEATOIRE. 


| x |, étant moins fine que | x | 
nombre réel b > 0 tel que 


,» il existe C(MNER. "IX, para. 3) un 


Ix |, <v 1x], (1) 
pour tout x € (X). D'où pour tout e'> 0, il existe € (=) tel que | x-y |, < e 
implique ||x-y |, << € 


En utilisant les mêmes notations que celles de la proposition IV, pour 
tout élément fixe a de (X), nous avons l'inégalité 


Is -al<Dptenl,x-als +-Hroeabl à 


qui est analogue à l'inégalité (11) de la proposition IV. 


Comme 1(X) est unemgyenne relative à K,, alors M|X-al, existe pour 
tout a € (X). D'où la série >) p(e,)|| &X-a|, , 8, € e., existe et en conséquence 
l'existence du membre de droite de (2) découle de (1). 

Comme lim ||s. - 1(X)], = 0, lim,| se -1(X)|, = 0. En prenant les limi- 
tes des deux membres de l'inégalité (2) quand £'—>0, on obtient 


1(X) - al,<1(|X - al.) (3) 


L'existence de la moyenne classique du nombre aléatoire | X-a|, 
résulte de l'existence de la moyenne classique du nombre aléatoire | X-a||, 
grâce à la relation (1) ; il en résulte de (3) la démonstration recherchée, 


5, - LES POSITIONS TYPIQUES D’UNE VARIABLE ALÉATOIRE SITUÉE 
DANS L’ESPACE EUCLIDIEN R°' 


Une position typique t(X) d'une variable aléatoire X existant relative- 
ment à une classe K définie par une norme | x|| sera dite exister relative- 
ment à |x| 


Différentes normes sont définies dans l'espace euclidien ; nous choisi- 
rons la norme | x|, = sup xl » x= (x,,..., x) € R' pour déterminer rela- 
tivement à lui quelques positions typiques d'une variable aléatoire X située 
dans R", 


5,1. La moyenne : Soit X= (1 ete et AS R° tel que X; = MX, existe pour 
tout i=1,2,...,n. X=(X1,... Xn) est une moyenne de X relativement à 


2 =| i=i ESS 


On peut facilement prouver, soit directement, soit au moyen de la 
proposition V, que X est aussi une moyenne relativement à | x| 


la norme | x 
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5,2. Position centrale : Soit X une variable aléatoire stochastiquement 
bornée (3) située dans R°, sur lequel une norme |x|, (x € R°) est définie, 
Une position centrale Y € R" de X, existe dans le sens de la définition (2) 
relativement à |x|, sify -a[ <N avec N=/|X-al|, indépendamment de 
a € R", N étant la valeur centrale du nombre aléatoire N. 


En général, relativement à || x|},, une position centrale d'une variable 
aléatoire stochastiquement bornée X € R", n'existe que ((3) p. 232) dans 
certains cas particuliers. Par contre, relativement à || xl, , qui est stric- 
tement moins fine (définition 3) que |x|, si X=(X,,... X,) est stochasti- 
quement bornée, X=(X,,... Xy)oùX;(i=1,... n)est la valeur centrale 
du nombre aléatoire X:, est aussi une position centrale de X. Car, X; 
étant la position centrale de X,, on a (5) : 


[X; -ai| <N, N; =|X; + al 
pour tout i=1,2,..,,n avec a; un nombre réel fixe quelconque, 
Et sia=(a,,..., a,) est un élément fixe quelconque de R", on a alors 
ON, <|X-al, =N d'où N;<N 


Ceci entraine finalement que | X; - a:| < N pour i=l,...,n, prouvant 
l'affirmation ci-haut, 


On remarque qu'une position centrale de XE R°', si elle existe (3) 
relativement à |x|,, existe aussi relativement à | x|,, mais que l'inverse 
n'est pas nécessairement vrai, comme on peut le voir par les exemples 
particuliers donnés par Fréchet ((3) p. 232). 


De plus, la position centrale X=(X,,..., X,) de X€ R°, relativement 
à ||x ||, est unique, En effet, s'il existe une autre position, centrale 
Y= (yirsess Yn) € R° de X, (YZÆX), relativement à ||x|,, , X; pour un 
certain entier j, (1< j<n). La variable aléatoire X étant stochastiquement 
bornée, on peut choisir un nombre réel c assez grand (c => 2K sil x|, <K) 
de telle manière que 


LR x< {ex <K<|,x;- | 


pour tout i # j et & € E (l'ensemble des évènements élémentaires), 


Pour a,={(a,,..., a,) avec a; = c et a; = 0(i-j), ona 
n,=[X- a, = |X- el 
Comme Y est une position centrale de X, |ÿ;- c[< y - a,| ,< N,; ou 
Iv=el= NN; où _Nj=|Xx;-cl| (1) 
Ceci est contradictoire puisque X; est la solution unique (5)de l'inégalité (1) 
5,3. Position équiprobable : Rappelons d'abord, afin d'éviter toute confu- 


sion, qu'on appelle valeur équiprobable d'un nombre aléatoire N, tout 
nombre certain y tel que l'on ait simultanément 


Prob [ N< v]l>7<Prob [ N = v] 


On représente un tel point V par la notation N. 
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Comme au paragraphe 5,2, on a vu que relativement à | x|,, une 
position équiprobable ((3) p.235) d'une variable aléatoire X=(X,,..X,.)€ R' 
n'existe pas en général, mais qu'elle n'existe que dans certains cas parti- 
culiers.. Mais relativement à |x|,, X=(X:,..., X,) où X;, (i=1,,.., n) 
est une valeur équiprobable du nombre aléatoire X;, est une positionéqui- 
probable de X,. 


En effet, pour N; = [x; - à; [avec a; = nombre fixe réel quelconque et 
1-0... RONA) | 


IX; = a:|< N. 


et la validité de l'affirmation ci-haut se trouve établie à l'aide de la pro- 
position suivante, puisque N;<N ={|x- a|,. 


PROPOSITION VI 
SOIENT L'(N)et L''(N) LES VALEURS EQUIPROBABLES INFERIEURE 


ET SUPERIEURE D'UN NOMBRE ALEATOIRE N ((4), p. 45). SI 
RARE [X<Y]}=1, X ET Y ETANT DEUX NOMBRES ÉDEMTOIRES, 
U'(X)< u'(Y) ET '(X)<p"'(Y) 
En effet, si L'(X)— H(Y), comme Prob{x<Y)]}= 1, ona 
{Prob[Y>u1(x)] |>{Prob[x=u'(v)]}>Prob[x>u'x) -e] 

où 2€ = '(X) - p'(Y)> 0. 
D'où {| Prob[ Y=u'(y)] |>1/2 
ce qui mène à une contradiction puisque L'(Y) est valeur équiprobable 
inférieure de Y. De même, si L(X) > Er), comme | Prob[x<Y)]|= 1; 
ona 

{Prob[x >u(x)]}<{Prob[Y Zu"(x)]}<Prob[ Yu" (y) +1 
où 2n=m'(X)-p'(Y)>0. 
Donc | Prob[ x>pu"(x)]}<1/2, 


ce qui est aussi contradictoire, puisque u"(X) est la valeur équiprobable 
supérieure de X, 
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DES DISTRIBUTIONS SYMETRIQUES A 
FONCTIONS CARACTERISTIQUES CONVEXES 


par 


Aurel WINTNER 


Soit p(t) une fonction paire, définie sur la droite-co  t — cet satis- 
faisant aux conditions suivantes : 


(1) #(t) est convexe (et continue) pour 0Zt — c 


et @(0) = 1, p(o) = 0, La fonction p{t), évidemment, est monotone et non- 
décroissante pour 0=Æt—, et, suivant Jensen, elle a pour 0=t—c des 
dérivées unilatérales finies, égales excepté sur un ensemble dénombrable 
de valeurs de t, De plus, w'(t) étant l'une de ces dérivées, -p'(t) est non- 
négative et non décroissante pour 0—t—c, Il est clair également que 
@(t) est absolument continue (de fait, elle satisfait à la condition de 
Lipschitz poure to, sie 0). Puisque l'intégrale de y'(t), prise de 0 
à o , est convergente, il s'ensuit d'après un lemme d'Abel que t@'(t)— 0 
quand t—0 et quand t—>c, 


Considérons la fonction 
co 
(2) J-90® sin xt dt 
met) 


Il est évident que -@'(t) est non-négative et non-décroissante, mais 
n'est pas une constante. Si x—0, l'expression (2) peut s'écrire sous la 
forme : 


TRUE 
F2 a | PER 2) -p'(t +n(k-1)/x)} sin xt dt 
0 


Puisque en chaque point de l'intervalle d'intégration, le k€ terme 


de la somme Z est non-négatif pour tout k, et positif pour certains k, et 
puisque sin xt est positif pour 0— t<n/x, il s'ensuit que la fonction (2) 
est positive pour tout x=0, Cette remarque fondamentale fut faite, citant 
Steffensen/[7], p. 184, per Lindhagen [4], puis par Polya ([5], p.378, 
Théorème VII où, cependant, la restriction f(co) = 0, f étant -w!', n'est pas 
mentionnée), et Steffensen [7 , récemment, a amélioré ce point. 

On voit aussi que la fonction impaire (2), outre qu'elle est positive 


pour tout x=0, est continue en chaque point x + 0, puisque la convergence 
est uniforme ou voisine de chaque x, fixe, positive. Mais une intégration 
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par parties montre que le produit de x par la fonction (2) est identique à 
nf(x), pour -œ<x<o, f(x) représentant la fonction 


(3) f(x) = 7/90) cos xt dt 
0 


(l'intégration par parties est légitime puisque to'(t)>0quettende vers 0 ou 
œ, ainsi qu'il a été dit plus haut). Par conséquent l'hypothèse (1) une fois 
associée aux hypothèses :@(0) = 0, @(oo) = 0 et pt) =p(-t), implique que 
pt) est la transformée de Fourier-Stieltjes d'une fonction de distribution 
absolument continue ayant une densité f(x) positive et continue pour 
0=x—, et, par suite, également pour -co<x<o , puisque f(x) = f(-x). 
Ce fait important et quelques-unes de ses conséquences ont été récemment 
soulignés par Polya [6], pp. 116-118. Pour une approche différente, cf. 
un article récent de Dugué et Girault [2]. 


Dans une note antérieure [9]; pp. 592-594, ce théorème était combiné 
à un résultat de A, Kneser (cf. la présentation de Borel [1], pp. 46-52, et 
une correction de l'un des énoncés de Kneser dans [8], p. 95; la forme 
finale de l'énoncé correct découle de [10] , pp. 601-602. 


En vue de l'application donnée dans (9] aux équations différentielles, 
mais surtout en raison de l'application à la théorie des probabilités, ce 
qui va suivre répondra à la question : quand la densité f(x) = f(-x) est-elle 
continue en x = 0 ? 


Il est clair que la condition 


(4) J ta <e (920) 


suffit à cette fin, puisque (4) entraine la convergence uniforme de (3) pour 
-00<_x< co, On montrera que cette condition suffisante est aussi néces- 
saire, Ceci est susceptible d'une interprétationsimple aux termes de la 
considération géométrique de Dugué et Girault [2], pp. 3-5. 


En fait, la démonstration sera faite de façon à prouver que si 
: Le +] 
(4 bis) J œ(t) dt =, (ÿZ 0) 


alors non seulement f(x) doit être discontinue au point x = 0 mais encore 
le devenir d'une façon tellement prononcée que 


(5) f(x)—oo , x — 0 


En corollaire il s'ensuit que f(x) doit être continue au point x = 0 
chaque fois que 


(5 bis) f(x)—constante , x—-0 


Un autre corollaire sera que ou bien (5) est vrai ou bien f(x) est non 
seulement continue pour -œ<Cx<_ mais en plus f(x)—0 quand | x|— 00. 


.. En fait cette dernière relation découle de (3) en vertu du lemme de 
Riemann-Lebesgue, si elle est applicable c'est-à-dire si (4) est satisfait. 
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Soit g(t) une quelconque fonction définie sur le demi-droit ouvert 
0—t— © de façon à remplir les conditions suivantes : g(t) est non-négative 
et monotone, g (œo)= 0, et 


1 co 


(6a) sf tg(t) dt < o , (6b) sk g (t) dt = oo. 
+0 1 


Alors, ainsi que (3) le montre, la fonction 


Lee] 
(7) h(x) = 'e(t) sin xt dt 
0 
doit satisfaire à la relation 
Choisissons 
(9) g(t) = -w'(t) ,; où 0<t—<o. 


Alors il est clair d'après les remarques faites au début de la note que les 
conditions spécifiées pour g(t) avant (6a) et (6b) sont remplies, de même 
que l'est la condition (6a) (et ceci, que l'on soit dans le cas (4) ou (4 bis)) 
Mais si on suppose (4 bis), alors la condition (6b) est aussi remplie. De 
fait, (6b) équivaut à (4 bis) en vertu de (9), Par conséquent, (8) est vrai 
dans le cas présent, 

D'autre part, on voit d'après (8) et (9) que h(x) est précisément l'inté- 
grale (2), Puisque l'intégration par parties, faite plus haut, montre que le 


produit den x par la fonction (3) est identique à l'intégrale (2), il s'ensuit 
que h(x) =rxf(x). Donc, (8) prouve (5). 
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THE DISTRIBUTION OF STATISTICS DRAWN FROM THE GRAM-CHARLIER TYPE 
À POPULATION, par URANISI 


Si M et © sont la moyenne et l'écart-type de la distribution d'une variable 
aléatoire, l'auteur assure pour cette distribution un développement de Gram- 
Chariier de type À jusqu'au 5€ ordre et calcule les distributions d'échantillonnage 
du statistique : 


(X = moyenne empirique calculée 
PATIO Xe x) 


puis du rapport F de deux variances empiriques indépendantes, Il en conclut quelques 
résultats concernant l'effet de la non normalité sur les distributions de t et du F 
classiques, 


RANDOM INTEGRATIONS, par T. KITAGAWA 


a) f(t) est une fonction définie et continue dans l'intervalle fermé (0, l)une approxi- 
mation de l'intégrale de f(t) sur (0,1) est de la forme : 


n 
Sa(£)=2; Aif(ti) Pete roro tel 


n 
\ 


As 01 A: 0 


i=1 


L'auteur envisage trois types d'intégration À, B, C : (A) f(t) estune fonction 
fixée, les pointe t, ... t,et les A; sont sélectionnés au hasard, 


b) f(t) appartient à une famille donnée de fonctions avec une probabilité convenable- 
ment définie (mesure de Wiener) et S, est une variable aléatoire ; (C) est une 
combinaison de (A) et (B). 

Pour chaque type le mode de détermination des ti et A; peut être envisagé 
sous 3 aspects. Alors l'auteur étudie les moyenne et variance des différentes sommes 
Sa (£f) ainsi définies, 
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NOTE OF THE USE ORDER STATISTICS, par K, KONO 


Le but de cet article est de fournir un procédé d'échantillonnage permettant 
une estimation suffisamment précise de la moyenne d'une variable aléatoire x au 
moyen d'une variable aléatoire auxiliaire y corrélée avec x pour laquelle l'échan- 
tillonnage est meilleur marché. La distribution de (x,y) est symétrique autour de 
l'origine (0,0) et la régression de x en y est linéaire. Lorsque la distribution de 
(x,y) est normale, il est possible de déterminer un procédé optimum (variance 
minimum de l'estimateur) qui assure un coût total d'échantillonnage C fixé. 


NOTE ON DOUBLE SAMPLING METHOD, par K. KONO 


Le problème traité est celui de trouver une condition pour laquelle une esti- 
mation basée sur la méthode d'échantillonnage double stratifié peut être plus précise 
que celle d'une méthode d'échantillonnage simple pour un coût total de l'échantillo- 
nage fixé. 


SOME CONSIDERATIONS ON THE RATIC AND REGRESSION ESTIMATES 
par M. MURAKAMI 


L'objet de cette note est de comparer les efficacités de l'estimateur qui 
consiste à utiliser le rapport-Ædes moyennes empiriques des variables aléatoires x 


et y corrélées (x variable auxiliaire) et la régression avec la moyenne empirique y 
pour estimer la moyenne m, de la variable y en faisant intervenir des considérations 
du coût d'échantillonnage, 


Vol. 5 - N° 1-2 Septembre 1952 


NOTE ON ENUMERATION OF 7 x 7 LATIN S QUARES, par K. YAMAMOTO, p. 1-9 


L'auteur reprend la méthode de Sade et étend ce mode de classification à tous 
les carrés latins en mettant en évidence une relation symétrique entre matrices 
incidentes fondamentales, 


STOCHASTICS STUDIES ON THE ATOMIC BOMB CASUALTIES par M.MASUYAMA 
p. 21-31 


L'auteur montre comment l'utilisation de quelques méthodes statistiques 
d'échantillonnages a permis de diriger une étude relative au nombre des décès 
causés par la bombe atomique à Hiroshima, 


ON THE STATISTICAL INFERENCES IN FINITE POPULATIONS BY TWO SAMPLE 
THEORY, par H. URANISI, p. 9-21 


Cet article fait suite à l'exposé de T, KITAGAWA (Mai 1951) au meeting 
annuel de la Société mathématique du Japon où il établit une méthode d'inférénces 
stochastiques sur les populations finies en considérant celles-ci comme un échan- 
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tillon de grandeur N d'une population infinie N. En supposant cette population infinie 
Tr Fi bp l'auteur fournit des intervalles de confiance avec un degré de significa- 
tion (1-0 


1°) pour la moyenne x et la variance S° de la population finie correspondante, 
2°) pour la différence X,-x, entre les moyennes de deux populations finies ainsi que 
pour le rapport : 


des variances de ces deux populations, Utilisant ensuite une approximation de 
Gram-Charlier de type A, il montre les effets de la non-normalité de TX sur les 
distributions de la moyenne x et de la variance, s!, empiriques de la population 
finie. 


CONVERGENCE OF INTEGRAL AND ITS APPLICATIONS, par M.IZAKI, p. 31-35 


Si f(t) est une fonction continue détinie dans 0<t <£ ; la somme: 


n 
cr ag Z f(&x) (t,- t,) converge lorsque Max (t, - t,,)—= 0.:où to = 0 ; tn =£ 


Si les n <points tiso.e th Sont triés au hasard et les &,choisis au hasard 
dansante est). Sy) est une variable aléatoire qui converge en probabilité vers 


L 
JE) dt quand n —>c; 
0 


Lorsque les t, ne sont plus aléatoires, mais l'intervalle (0,{) divisé en n 
strata de longueur D les résultats sont analogues, L'auteur montre une application 


à un intégrateur pour lequel le calcul est fait de telle manière que t soit prélevé 
séquentiellement et t soit un processus aléatoire de Poisson, 


SUCCESSIVE PROCESS OF STATISTICAL INFERENCES, par T. KITAGAWA, 
p. 35-51 

Dans une première partie, l'auteur montre comment substituer à l'écart-type 
empirique lors de l'utilisation du test du t avec une application aux cartes de 
contrôle ; en particulier si X,.., Xh_j» Wj, W,,... On, Sont les Moyennes etéten- 
dues empiriques calculées à partir d'échantillons 0,, 0,,... 0, provenant d'une 
même population, il est possible de déterminer un test ayant undegré de significa- 
tion (1 -x) pour étudier si un échantillon ©, provient de cette même population. 

Dans une deuxième partie, l'auteur obtient pour le test de Fisher-Behrens 
(comparaison de deux populations normales de moyennes et variances inconnues) 
une région critique dont les limites sont fixées à l'avance ; il en déduit un intervalle 
de confiance pour la différence entre les moyennes de deux populations normales 
d'étendue égale à { fixée. 


RANDOM FREQUENCY PROCESS, par T, ONOYAMA, p. 51-53 


Soit x(t) = >_a,(w) ALLO LE" processus stochastique où les a,, X, sont des 
variables aléatoifés réelles, indépendantes telles que 


ZE (as) < © 


Un tel processusest dit (r.f.p.)(random frequency process). L'auteur montre: 
1°) qu'un processus r,.f.p. est stationnaire au sens faible et il est possible de 


4 
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construire un processus r.f.p. ayant une distribution spectrale continue ou une 
fonction d'autocorrélation donnée de type stationnaire. 


2°) Le spectre S(A,w) d'un processus r.f.p. est S(X) 22) an MN 


= 


3 


où Ÿ, est une fonction aléatoire indépendante des a, ne pouvant prendre que le 
1 


système de valeurs (0,1); (7 +) ; (-1,0) et réciproquement, 


MINIMAX ESTIMATIONS, par K. MIYASAWA, p, 53 


Cet article fait suite à celui l'On the statistical decision function l'', Bull. 
Math. Stat, Research, vol, 4 - 1950, 


Vol. 5 - N° 3-4 Juin 1953 


ON THE FILTER PROBLEM OF A STATIONARY STOCHASTIC PROCESS, par 
S. KANO, p. 47 


Etant donné un processus stochastique stationnaire x(t) représentant un mes- 
sage, et deux processus stationnaires y(t) et z(t) représentant le bruit, il est possi- 
ble de déterminer une fonction Kkj « qui minimise : 


E (FÉPATE + x(t-o) d(t-0)| ak (o)|| 


Si k(w) hs aK(o) 


k(w) est une fonction rationnelle, n'ayant pas de zéros dans le 1/2 plan inférieur 
tandis que le numérateur n'a aucune singularité dans ce même 1/2 plan, 


NOTE SUR L'ESTIMATION DE LA VALEUR MOYENNE D'UN PROCESSUS 
STOCHASTIQUE, par À. KUDO, p. 53-58 


Le but de cet article est de discuter quelques combinaisons de la théorie de 
l'estimation linéaire de la fonction valeur moyenne d'un processus stochastique 
dues à O. GRENENDER et la notion d'intégration aléatoire de type À introduite par 
T. KITAGAWA,. Dans le deuxième paragraphe est étudiée l'estimation dela fonction 
valeur moyenne d'un processus stochastique sous la condition que l'observation 
continue de la réalisation du processus stochastique n'est pas possible, Letroisième 
paragraphe est consacré à la discussion du cas spécial où le processus est station- 
naire. 


SOME STOCHASTIC CONSIDERATIONS UPON EMPIRIAL FUNCTIONS OF VARIOUS 
TYPES, par T. KITAGAWA, p. 19 


L'auteur expose quatre procédés pour construire un modèle mathématique 
représentatif d'un phénomène dans un intervalle de temps (0,1). Les cas suivants 
sont envisgés : 
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(A) I existe une fonction certaine g{t) inconnue, € L/(0, ce) ; 


‘ co s 
(B) La fonction g(t) est un processus stochastique de la forme 3 À? Q{t) Zy où 
Ÿ=1 


les ®,(t) et À, sont connues et les z, sont des variables aléatoires normales, indé- 
pendantes (a,,o°), 


Il s'agit de représenter g(t) à l'aide d'une fonction empirique (t,n) formée : 
(D) à partir des résultats des r;j observations Yi = g(ti) +€:;; . Aux points ti fixés 
à l'avance [les £;; sont des variables aléatoires normales indépendantes (0, ©?) }; 
(C) à partir des n réalisations f;(t) de g(t) dans un même intervalle de temps. 


. Dans une deuxième partie, l'auteur donne une approximation empirique de la 
dérivée de g(t) mais signale des difficultés rencontrées dans ce problème. 


ON THE DETERMINATION OF SAMPLE SIZE FROM THE TWO SAMPLES 
THEORICAL FORMULATION, par T. KITAWAGA, T. KITAHARA, NOMACHI ; 
N. WATANABE, p. 35 


Le problème est de déterminer pour la moyenne m d'une population normale 
d'écart-type © inconnu, un intervalle de confiance (niveau 1-x) dont l'étendue est 
inférieure à Zœfixée, Un premier échantillon ©O,.(x,,,x x,,)est prélevé à l'aide 

1 


12°? .. 
duquel est calculée la variance empirique 8, ; 


Une formule permet de déterminer la taille n, d'un deuxième échantillon à 
partir de s,, de manière qu'il y ait une probabilité supérieure à (1-(@) que la 1/2 
étendue de l'intervalle de confiance pour m, évalué à l'aide de ce deuxième échan- 
tillon soit inférieur à &. 
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A CONTRIBUTION TO A NOTATION SYSTEM OF THE CONFUNDED FACTORIAL 
EXPERIMENTS, par T. KITAGAWA et M. MITOME, p. 1-11 


Le but de cet article est d'expliquer les nouveaux systèmes de notation propo- 
sés par les auteurs à l'the branch Meeting of Japonese Math, Soc. ''Kumamoto Uni- 


versity fev. 1951'!, 


ON THE WEIGHTED POWER FUNCTIONOF SOME TESTING HYPOTHESES, p.11-17 


Soit 0 (8,,... 0) un paramètre dont le domaine des valeurs possibles est Q ; 
w,,wW, deux suites disjointes de (1, pour tester (H,) 8€ w, contre H, 8€ w, l'auteur 
détermine une région critique qui minimise l'aire limitée par la fonction puissance 
du test dans le cas où 0 Eu, . 

Si w, se réduit à 0 = 0, et H, est 0Ew,, il retrouve le lemme de Neymann 
Pearson ; si &, est quelconque, u(e) est la distribution de 8 dans w,, W,(x) la proba- 
bilité d'accepter H, quand x est la valeur observée de X(X;. ) 


Alors Po(x) est définie par 


Y.(x) =] quand / f(x,8) da0 >xf, 1x,0) du(6) 
x) = 0 uand f(x,8) 48<k f(x,0) du(8) 
Pol ) qua 1 nm 


%o 


où kest une constante, 
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De plus Yy(x) € D, clagse des tests ÿ pour lesquels la puissance f(0,9)<œ 
pour tout 8 € w, et Bu, #,) = B (9,9) dp(0)= x 
QT) 


TABLES FOR TESTING RANDOMNESS BY MEANS OF LENGHTS OF RUNS, par 
M. TAKASHIMA, p. 17-25 


Si Q,(t) est la probabilité d'apparition d'au moins une suite de A de longueur t 
ou plus, Q(t) celle d'au moins une suite de À ou B de longueur t ou plus, l'auteur 
désigne par t,, ti, £s, à les plus petits entiers t pour lesquels Q(t) [a.(t)] est 
inférieur à 0,05 ou 0,01. En désignant par met n le nombre total des A et des B, 
F. MORTELLER avait déjà calculé ces valeurs lorsque m=n=5; 10; 15 ; 20 ; 25. 


[ Note on an application of runs to quality control charts, Ann. Math. Statist. (12) 
- 1941 -] 

Dans cette note quatre tables fournissent les valeurs de t,, ts: Ce # pour 
1<m<25 


inaisons m n avec 
toutes les combinaisons de et l<n-Æ 25 


AUXILIARY TABLES FOR THE APPLICATIONS OF n-DIMENSIONAL t. DISTRIBU- 
TIONS TO CERTAIN CLASS OR EMPIRICAL FUNCTIONS, par Y. NOMACHI, p, 25-49 


Cet article fait suite à celui de T. KITAGAWA : ''Some stochastic Considera- 
tions upon empirical Functions'! (Bull. Math. Statist. Col. 5 - n° 3-4) et fournit des 
tables permettant de calculer rapidement les fonctions empiriques proposées par 
T. KITAGAWA pour représenter une fonction inconnue g(t). 
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LES MODÈLES STATISTIQUES COMME AUXILIAIRES DANS LA DESCRIPTION 
DE LA NATURE, par H,. VON SCHILLING 


L'auteur décrit quelques modèles statistiques qui lui paraissent plus aptes à 
décrire la réalité : 


1°) On étudie un évènement ayant les propriétés suivantes : a) il se produit 
avec la probabilité p par unité de temps, b) une fois qu'il s'est produit, il ne peut se 
produire dans les k unités de temps suivantes, c) il a été observé au temps n, 


On calcule la probabilité W(m,n,k,p) que cet évènement ait étéle mième 
depuis le temps O. Le modèle ainsi défini fournit une généralisation de célui de 
Bernoulli, car pour k=0 on obtient la distribution de Bernoulli B(m-l,n-1,p} 


Le modèle parait apte à décrire des phénomènes nécessitant un temps de 
récupération {utilisation dans la statistique des caisses de maladie), 


2°) Soit X; une suite de v,a. laplaciennes réduites, On sait que S,= D X; est 
1= 


une v.a, laplacienne d'e.m, nulle et dont l'e.q.m. ©,= Vn tend vers co lorsque 
n— 00 , Il existe des phénomènes presque périodiques où un tel accroissement de ©, 
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est impossible, Soit par exemple V; le volume d'air inspiré par une personne en 
temps i. Le volume est soumis à des fluctuations et si l'on pose D, = V-V 
D =V, = Vi... Dan= Va - Vas, il vient Vi = Vo + D; . Il est évident que D; ne 
peut suivre une loi de Laplace, sans quoi V, tendrait vers l'oo lorsque n—c, L'au- 
teur propose pour D; la distribution de densité : 


Se 
PR 

w(y) = De 
©: 
We dx 


3°) On définit des cheminements aléatoires sur une surface déterminée de la 
façon suivante : une particule part du point O sur la surface suivant un élément de 
courbe possédant en © la courbure géodésique Kg(O). Après avoir parcouru un 
élément de courbe de longueur constante ds, elle peut changer de direction suivant 
une loi normale, On cherche les chemins les plus probables, On montre qu'ils sont 


définis par la condition suivante : f'ké(s) ds = minimum, L'auteur donne des solu- 
0 


tions explicites pour le plan et la surface de la sphère, 


a 4°) Pour décrire, en mécanique, le passage du repos au mouvement, l'équation 
F=ml ne suffit pas ; celle-ci n'est valable qu'après l'établissement d'uncertain 
régime précédé de phénomènes transitoires, L'auteur propose un modèle statistique 
pour décrire ces phénomènes transitoires, modèle qui conduit à postuler l'existence 
d'un intervalle de temps élémentaire, 


LA DISTRIBUTION NORMALE TRONQUÉE TRAITÉE GRAPHIQUEMENT SUR DU 
PAPIER DE PROBABILITÉ, par K. STANGE 


Un procédé de fabrication a fourni un lot d'objets dont la caractéristique suit 
une loi normale (H,9). Si la frontière de tolérance T est située à droite de u-30, il 
faut rejeter du lot les objets défectueux dont le pourcentage sera désigné par A“, 
Le pourcentage des objets prêts pour la consommation sera alors nécessairement 
B* = 1-A*, 

Soit F(x) la fonction de répartition de X, On a alors évidemment F(T) = A*, 
Etudions l'ensemble B* séparément. B* est caractérisé au moyen des paramètres 
H»0,T etde A*= F(T). Le problème se pose alors de trouver, à partir de la fonction 
de répartition empirique B (x) de B* , des estimations T,x,s,ÂÀ pour les paramètres 
Tru,0,A* . L'auteur donne une solution graphique de ce problème en employant du 
papier de probabilité, Application à un problème concret. 


UN NOUVEAU GENRE DE NOMBRES ; SES PROPRIÉTÉS ET SES APPLICATIONS 
EN STATISTIQUE MATHÉMATIQUE, par I. LAH 


Posons (X), =X(X+1)(X+2)...(X-n+1). Les nombres de Stirling de 1ère espèce 
M4 sont définis par l'identité (X), =2 SY X” et ceux de 2€ espèce A par l'identité 
n 4 
x" = 2 Y(X),. 


L'auteur définit un nouveau genre de nombres par analogie de la manière sui- 
vante: Posons (x, =X(X+1)(X+2)...(X4n-1), On définit des nombres s' par l'identité 


n n 
EX = 2 1Y s(X), ou l'identité (X), =2 (1) s(X),. Ces nombres ont des pro- 
priétés remarquables très faciles à démontrer, On peut par exernple les représenter 


n d . 
en fonction des nombres de Stirling de 1ère etde 2€ espèce suivant: s*=>;(-1) S; 1% 
i=V 


54 MITTEILUNGSBLATT FÜR MATHEMATISCHE STATISTIK 


Comme applications à la statistique, notons les identités : 


2{[4=2200 PI, =22 (-1) sÿ E{(x),] 


Val 


2 {00,250 00, 222 (-'si E{ [2] 


rit - 2 d 
ainsi que le résultat suivant : Définissons un opérateur par x ax Alors 


n n . 
5) SE (-1)sY > CM LE partir de cette formule l'auteur établit quelques iden- 


tités concernant les fonctions génératrices, 


SUR LA SURFACE INTERIEURE D'UN AMAS DE SPHERES, par H.L. DE VRIES 


Considérons une distribution au hasard de sphères dans l'espace. On s'inté- 
resse souvent à la densité de probabilité f(x) de la distribution des diamètres x de 
ces sphères. Dans le présent travail l'auteur se propose de déterminer la surface 
totale O; des sphères contenues dans un volume V. A cet effet on n'a besoin que du 
2e, éventuellement du 3€ moment de f(x). Comme application il faut songer à la 
surface intérieure O; d'un volume V de coke. La connaissance de Oj est importante 
car l'activité du coke dans le haut-fourneau lui est liée, 
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PASSAGE DE LA SOLUTION DU CENTRE DE GRAVITÉ A CELLE DES AXES PRIN- 
CIPAUX ET AUTRES DEVELOPPEMENTS DES MÉTHODES D'APPROXIMATION EN 
ANALYSE FACTORIELLE, par Von Rolf Bargmann 


En analyse factorielle la méthode des moindres carrés conduit à la solution 
dite des axes principaux (principal axes solution) qui a l'inconvénient de mener à des 
calculs fastidieux. Le présent travail expose une méthode qui, partant de la solution 
habituelle du centre de gravité, permet un passage rapide à celle des axes princi- 
paux, Nombreuses applications, 


THÉORÈMES LIMITE RELATIFS A DES PROBABILITÉS DE PASSAGE TENDANT 
VERS O, par V. KANNGIESSER 


On considère une chaine de Markoff discrète admettant deux états possibles 


0 et 1, Soit V = ee Le ) la matrice des probabilités de passage. On suppose que l'on 
10 ul 
est dans le cas régulier. Deux problèmes se posent : 


1°) Problème de Bernoulli: déterminer la probabilité w,(x,V),x = 1,..,,n pour que, 
dans les n premières épreuves il y ait x états 1, 


25) Problème de Pascal: Déterminer la probabilité w., (2: NV) 2 108 Fe MpoRE que 
le mième état 1 se produise à la m +zième épreuve. 


L'auteur se propose d'étudier le comportement asymptotique des probabilités 
wW(x, V) et W(z,V) lorsque n (respectivement m)tendent vers l'infini. Il montreen 
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particulier que si l'une des probabilités de passage Vij 5 i,j = 0,1 tend vers 0 comme 
1 Z ; 
7 les quantités w.(x, V) et (x, V) tendent vers une limite commune qui n'est autre 


x 
que 12 distribution de Poisson Y{(x,k) _. e “, Un autre cas de limite commune est 
discuté. 


PROCÉDÉS DE CONTRÔLE POUR DES VARIABLES A INTERVALLE DE CONFIANCE 
LARGE ET ETROIT, par K. BRUCKER-STEINKUHL 


Travail d'exposé illustré par de nombreux exemples. 


SUR LA THÉORIE STOCHASTIQUE DE L'ITÉRATION DES CARACTÈRES (RUNS) 
par Otto LUDVIG 


L'auteur donne une excellente introduction historique, un aperçu pratiquement 
complet de l'état actuel de la théorie des runs ainsi qu'une bibliographie exhaustive. 
Il se pose ensuite le problème suivant : Déterminer la probabilité pour que, dans 
une suite ordonnée de n éléments il y ait exactement (ou au moins)v itérations. Ce 
problème peut être résolu de deux manières différentes, soit par l'analyse combi- 
native, soit par la théorie des équations aux différences finies, C'est à cette der - 
nière méthode que l'auteur donne sa préférence. 


APPLICATION DE LA LOILOG-NORMALE, par Rolf WARTMANN 


Suite d'un travail antérieur paru dans cette revue 7 (1955), sept. 2. Dans ce 
travail antérieur l'auteur avait montré comment on peut passer d'une distribution 
log-normale à une distribution normale empirique. Il avait également établi des 
formules pour les variances des paramètres empiriques d'une telle distribution 
log-normale, à savoir : moyenne u, e.m.q.o, asymétrie ÿ1. 

Dans le présent travail, l'auteur déduit la variance du point de fuite empiri- 
que 2, U donne également des indications relatives à l'étude de l'échantillonnage 


lorsqu'on 2 affaire à une distribution log-normale, Application à un problème 
concret, 
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